当前位置：币须知道 > 精选主题 > 时事热门话题 > 正文

考普斯总统奖得主苏炜杰加盟OpenAI参与模型训练，并晋升宾大正教授

2026-05-31 分类：时事热门话题阅读(45) 评论(0)

据动察 Beating 监测，北京大学数学科学学院 2007 级校友、斯坦福大学统计学博士、宾夕法尼亚大学沃顿商学院正教授苏炜杰（Weijie Su）在社交平台 X 上官宣，已于沃顿商学院休假期间正式加入 OpenAI。苏炜杰表示，时隔十年重回湾区，将参与 AI 模型训练。同时，经过十年的学术耕耘，苏炜杰已正式晋升为宾夕法尼亚大学沃顿商学院统计与数据科学系正教授（Full Professor）。

苏炜杰在统计学、机器学习优化以及大语言模型（LLM）理论安全领域贡献卓越。他在 2026 年获得考普斯会长奖（COPSS Presidents’ Award），是国际统计学领域的最高荣誉之一。COPSS 官方在颁奖词中高度评价了他在建立生成式 AI 统计学基础（包括 LLM 的水印机制、人类偏好对齐和排序理论）、推进 2020 年美国人口普查中的差异隐私（Differential Privacy）数据分析方法，以及对深度学习理论、凸优化与高维统计推断方面的奠基性贡献。

学术研究上，苏炜杰在大模型统计学底层重塑上取得了多项进展。在大模型水印检测上，他将水印技术公式化为统计假设检验问题，提出「截断拟合优度检验」（Tr-GoF）。Tr-GoF 能够在不依赖人类编辑过程先验知识或精确概率的情况下，提高对修改与剪裁文本的水印检测鲁棒性。在偏好对齐（RLHF）上，苏炜杰指出传统 RLHF 因基于排序的优化机制极易导致「偏好崩塌」（Preference Collapse），即忽略少数群体偏好，使不同提示词的奖励分布趋于单一。为了保留回复多样性，团队通过求解常微分方程（ODE）推导出「偏好匹配」（Preference Matching）正则化方案，在最大化人类奖励的同时避免回复单一化，并探索博弈论视角的「基于人类反馈的纳什学习」（NLHF）以替代传统标量奖励对齐。

苏炜杰本科毕业于北京大学数学科学学院，属于媒体和学者所称的北大数院「黄金二代」（或「白金一代」）。相较于以纯数学研究见长的 2000 级「黄金一代」（如恽之玮、张伟、许晨阳等），以苏炜杰为代表的 2007 级学者展现出更宽广的跨学科特征，将数学边界拓宽至统计学、数据科学与人工智能领域。

赞(0)

未经允许不得转载：币须知道 » 考普斯总统奖得主苏炜杰加盟OpenAI参与模型训练，并晋升宾大正教授

相关推荐

评论抢沙发

回顶部