2025/09/06 23:29:13 1,711次浏览

新智元报道

编辑:KingHZ 好困

【新智元导读】OpenAI重磅结构调整:ChatGPT「模型行为」团队并入Post-Training,前负责人Joanne Jang负责新成立的OAI Labs。而背后原因,可能是他们最近的新发现:评测在奖励模型「幻觉」,模型被逼成「应试选手」。一次组织重组+评测范式重构,也许正在改写AI的能力边界与产品形态。

就在刚刚, OpenAI决定 —— 重组 ChatGPT「个性」研究团队 !

这个约14人的小组,规模虽小但责任重大——他们要负责让GPT模型知道该怎么和人类进行交互。

根据内部消息,模型行为团队(Model Behavior team)将直接并入后训练团队(Post-Training team),并向后训练负责人Max Schwarzer汇报。

团队前负责人Joanne Jang,从头开始新的实验室「OAI Labs」——为人类与AI的协作方式,发明并构建新的交互界面原型。

与此同时,OpenAI还非常罕见地发了一篇论文揭秘——让AI产生「幻觉」的罪魁祸首,就是我们自己!

整个行业为了追求高分排行榜而设计的「应试」评估体系,迫使AI宁愿去猜测答案,也不愿诚实地说出「我不知道」。

论文地址:https://openai.com/index/why-language-models-hallucinate/

超现实的一天

模型行为团队 几乎参与了GPT-4后的全部模型研发,包括GPT-4o、GPT-4.5以及GPT-5。

上周,作为 Model Behavior 团队负责人的Joanne Jang,登上 《时代》百大AI人物榜单 的「思想家」(Time AI 100 Thinkers),超越图灵奖得主、深度学习三巨头之一的Yoshua Bengio、谷歌首席科学家Jeffrey Dean等大佬。

就在同一天,OpenAI决定将她从 团队调离,自己去负责一个新的方向。

对她而言,那天的确是「超现实」

Joanne Jang认为,她的工作核心在于「赋能用户去实现他们的目标」,但前提是不能造成伤害或侵犯他人的自由。

她直言:AI实验室的员工不应该成为决定人们能创造什么、不能创造什么的仲裁者

开启新征程:瞄准下一代AI交互

刚刚,Joanne Jang发文表示她已有新的工作职位:发明和原型化全新的交互界面,探索人与AI协作的未来方式。

她将从头开始负责新的OAI Labs实验室:一个以研究为驱动的团队,致力于为人类与AI的协作方式,发明和构建新界面的原型。

借此平台,她将探索超越聊天、甚至超越智能体的新模式——迈向能够用于思考、创造、娱乐、学习、连接与实践的全新范式与工具。

这让她无比兴奋,也是过去四年在OpenAI她最享受的工作:

把前沿能力转化为面向世界的产品,并与才华横溢的同事们一起打磨落地。

从DALL·E 2、标准语音模式,到GPT-4与模型行为,她在OpenAI的工作涵盖不同的个性化与交互方式。

她学到了很多,体会深刻:

塑造一个界面,是多么能够激发人们去突破想象的边界。

在接受采访时,她坦言,现在还在早期阶段,究竟会探索出哪些全新的交互界面,还没有明确答案。

我非常兴奋能去探索一些能突破「聊天」范式的模式。聊天目前更多与陪伴相关;而「智能体」则强调自主性。

但我更愿意把AI系统视为思考、创造、游戏、实践、学习和连接的工具。

OpenAI的模型行为研究员,负责设计和开发评测体系(evals),横跨多个环节:

对齐(alignment)、训练、数据、强化学习(RL)以及后训练(post-training)等。

除了研究本身, 模型行为研究员 还需要具备对产品的敏锐直觉,以及对经典AI对齐问题的深刻理解。

OpenAI对模型行为研究员的经验要求

在之前的招聘中,OpenAI称: 模型即产品,而评测体系就是模型的灵魂 。

但OpenAI最新发布的研究显示: 评测体系从根本上决定了模型。

在论文中,研究人员得出结论:

实际上,大多数主流评测在 奖励幻觉行为 。只需对这些主流评测进行一些简单的改动,就能重新校准激励机制,让模型在表达不确定性时获得奖励,而不是遭到惩罚。

而且这种方式不仅能消除抑制幻觉的障碍,还为未来更具细微语用能力的语言模型打开了大门。

这一发现对OpenAI很重要:评测体系直接影响LLM的能力。

据报道,在发给员工的备忘录中,OpenAI首席科学家Mark Chen指出,把模型行为进一步融入核心模型研发,现正是好机会。

我们亲手让AI学会了一本正经地胡说八道

就在最近,OpenAI的研究员就做了一个有趣的测试。

他们先是问一个主流AI机器人:「Adam Tauman Kalai(论文一作)的博士论文题目是什么?」

机器人自信地给出了三个不同的答案,但没有一个是正确的。

接着他们又问:「Adam Tauman Kalai的生日是哪天?」

这次机器人还是给出了三个不同的日期,同样全是错的。

为了拿高分,AI被逼「拍脑袋」作答

上面这个例子,生动地展示了什么是「模型幻觉」——即AI生成的那些看似合理、实则虚构的答案。

在最新的研究中,OpenAI指出:

模型之所以会产生幻觉,是因为标准的训练和评估程序奖励猜测行为,而非鼓励模型承认其不确定性。

简单来说就是,我们在评估AI时,设定了错误的激励导向。

虽然评估本身不会直接造成幻觉,但大多数评估方法会促使模型去猜测答案,而不是诚实地表明自己不确定。

这就像一场充满选择题的大型「应试教育」。

如果AI遇到不会的题目,选择留白不答,铁定是0分;而如果随便猜一个,总有蒙对的概率。

在积累了成千上万道题后,一个爱「蒙答案」的AI,就会比一个遇到难题时表示「不知道」的AI得分更高。

当前的行业主流,便是用这种「唯准确率论」的排行榜来评判模型优劣。

这无形中鼓励所有开发者去训练一个更会「猜」而不是更「诚实」的模型。

这就是为什么即便模型越来越先进,它们依然会产生幻觉。

为了有一个更直观的感受,我们来看看OpenAI在GPT-5系统卡中公布的一组对比数据:

从数据中可以发现:

在准确率上,旧模型o4-mini的得分更高(24% vs 22%)。

但代价是,几乎从不弃权(1%)的o4-mini,错误率(幻觉率)直接飙到了75%

相比之下,新模型gpt-5-thinking-mini表现得更为「谨慎」,它在52%的情况下选择不回答,从而将错误率控制在了26%

幻觉源于「下一个token预测」

除了评估体系的导向问题,幻觉的产生还与大语言模型的学习机制息息相关。

通过「下一个token预测」,模型掌握了语法、语感和常识性关联,但它的短板也正在于此。

对于高频、有规律的知识,比如语法、拼写,模型能通过扩大规模来消解

对于低频、任意的事实,比如生日、论文标题,模型则无法从模式中预测

理想情况下,这些幻觉应该能在模型预训练完成后的环节中被消除。

但正如上一节所述,由于评估机制的原因,这一目标并未完全实现。

如何教AI「学会放弃」?

对此,OpenAI的建议是:

应该重罚「自信地犯错」(confidential error),并为「诚实地承认不确定性」给予加分。

就像我们考试中的「答错倒扣分」机制一样。

这不仅仅是通过加入新评测来「补全」就行的,而是要更新所有主流的、依靠准确率的评估体系。

最后,OpenAI也集中回应了关于幻觉的几个常见误解:

误解1: 幻觉能通过100%的准确率来根除。

发现: 准确率永远到不了100%。因为真实世界中,总有很多问题因信息不足或本身模糊而无法回答。

误解2: 幻觉是不可避免的。

发现: 并非如此。模型完全可以在不确定时选择「弃权」,从而避免幻觉。

误解3: 只有更大的模型才能避免幻觉。

发现: 有时,小模型反而更容易认识到自己的局限性。让模型准确评估自己的「置信度」(即做到「校准」),比让它变得无所不知要容易得多。

误解4: 幻觉是一个神秘的、偶然的系统故障。

发现: 我们已经理解了幻觉产生的统计学机制,以及现有评估体系是如何无意中「奖励」这种行为的。

误解5: 要衡量幻觉,只需要一个好的评测。

发现: 幻觉评测早就有了。但在数百个奖励猜测的传统基准评测面前,一个好的幻觉评测收效甚微。正确的做法是,重新设计所有主流评估,加入对模型表达不确定性行为的奖励。

参考资料:

https://techcrunch.com/2025/09/05/openai-reorganizes-research-team-behind-chatgpts-personality/

https://openai.com/index/why-language-models-hallucinate/

OpenAI重组GPT-5「灵魂」团队!亚裔女负责人遭调离,罕见自曝AI幻觉祸首
OpenAI重组GPT-5「灵魂」团队!亚裔女负责人遭调离,罕见自曝AI幻觉祸首

特朗普将国旗当毯子说晚上可以用

「活动」kumawubiaotitest

9.71MB
版本V3.341.38
下载冰公主裸体被❌叫爽漫画安装你想要的应用 更方便 更快捷 发现更多
喜欢 51%好评(8人)
评论 16
OpenAI重组GPT-5「灵魂」团队!亚裔女负责人遭调离,罕见自曝AI幻觉祸首截图0 OpenAI重组GPT-5「灵魂」团队!亚裔女负责人遭调离,罕见自曝AI幻觉祸首截图1 OpenAI重组GPT-5「灵魂」团队!亚裔女负责人遭调离,罕见自曝AI幻觉祸首截图2 OpenAI重组GPT-5「灵魂」团队!亚裔女负责人遭调离,罕见自曝AI幻觉祸首截图3 OpenAI重组GPT-5「灵魂」团队!亚裔女负责人遭调离,罕见自曝AI幻觉祸首截图4
详细信息
  • 软件大小: 7.8MB
  • 最后更新: 2025/09/06 23:29:13
  • 最新版本: V6.902.7
  • 文件格式: apk
  • 应用分类:ios-Android 富婆大屁股日屄视频
  • 使用语言: 中文
  • : 需要联网
  • 系统要求: 5.960以上
应用介绍
一,国产Chinese男男GayGay✅,韩国美女露出奶头❌跳舞视频
二,中国老妇女35XXXXHD,佐助❌鸣人18同人禁漫画
三,大胸美女白丝❌爆爽91,❌❌❌❌69日本12秒
四,男生把小困困进女生,′人与狗三级黄片毛多浓密老熟女洗澡自拍
五,男GaYGAYS✅免费自慰,美女隐私㊙️洗澡视频
六,香港明星裸体1970,r星在线无限看❤免费下载,免费无遮挡🔞网站动漫
七,91TV国产成人🔞
【联系我们】
客服热线:134-2881-646
加载更多
版本更新
V7.5.17
温迪被❌吸乳羞羞动漫
  • 91影库永久在线播放

    王俪丁裸体㊙️无遮挡

    异类女人与性动交zo

    005.57MB
    102好评

    日本🔞无遮挡裸打屁屁图片

  • 麻豆禁漫❌18禁动漫下载

    涩里番㊙️18p🈲在线观看

    韩国19➕禁福利vip视频bj

    9.26MB
    92好评

    班长让我吃他🐻我脱她衣服软件

  • 欧美❌❌粗暴se喷水

    中国女人做受❌❌❌高潮网站

    白丝校花🌸扒开美腿甜美小说

    13.25MB
    315好评

    女学生被c扒衣服电影

  • 被❌到爽🔞高潮痉挛视频

    14may12_XXXXXL56edu

    扒开老师❌狂揉❌❌❌在线观看

    53.21MB
    271好评

    8x8拔擦拔擦在线观看免费视频

  • 珍妮捆绑❌触手❌大胸

    亚洲一级黄色淫秽色情电影

    男男GAY无套✅浴室视频网站

    71.34MB
    702好评

    成人🔞色情美女侵犯

  • 王者女被❌超污裸体网站

    欧美少妇日血

    扒开🐻让我❌❌❌真人视频在线

    83.14MB
    337好评

    furry同人❌黄动画网站

  • 男男做爱视频在线观看2023

    欧美成人无码观看🔞免进

    日本肉体裸交❌❌❌❌在线观看

    23.81MB
    103好评

    gv自慰🔞免费网站

  • 钟离同人18❌漫画免费

    乖我硬了~你的里面好疼视频

    潘金莲AAAAAA播放

    50.72MB
    923好评

    动漫被c到爽🔞巨乳一在线看

  • 中国白嫩丰满人妻videos

    撸大师一区

    美女裸体㊙️free免费网站

    83.26MB
    564好评

    巴西性狂野妇女A片

  • 蘑菇视频频🔞❌♋少罗曼

    岳故意装睡让我挺进去的软件

    免费➕无码➕国产优嘿在线观看

    83.20MB
    751好评

    二次元兔女郎自慰❌挤奶羞

  • 挤奶➕虐菊➕虐乳

    迪丽热巴裸乳被爆❌白浆的视频

    女同桌脱👙给我揉🐻网站

    32.36MB
    625好评

    美女🈲流出白色液体视频

  • 美女尿囗㊙️免费照片

    紧身衣猛❌喷水爽自慰

    AV➕无码➕高潮➕国产

    26.26MB
    279好评

    宝贝c我想摸你奶让我揉揉说说

  • 纲手被爆❌自慰流水

    免费观看学生黃色A片

    韩国美女小黄片

    65.84MB
    749好评

    免费看裸体🔞🔞🔞网站果冻

  • 男人的🍌伸到🍑里网站

    91丨国产丨白浆㊙️洗澡游戏

    极品婬荡少妇80XXXXX

    54.51MB
    759好评

    胬肉1993意大利

  • 最新成人网址68uuu.com

    动漫动画裸体做🔞🔞🔞

    麻国产短视频➕白嫩精品

    57.36MB
    685好评

    星野✌和老头的视频免费看

  • 成人做爰黄✌片免费看

    动漫操女人

    玖辛奈被扒开腿❌下载网站

    24.49MB
    355好评

    国产精品🍊

  • 中国裸体裸乳🍑免费看

    ㊙️黄😍视频党免费看网站游戏

    国语对白少妇做爰免费视频

    13.57MB
    317好评

    麻花传MD0190苏畅我回来了

  • 免费看美女裸体🔞🔞🔞av

    老师扒开腿㊙️让我爽了网站

    免费无遮挡🔞视频群

    84.64MB
    210好评

    扒开美女❌真人❌羞羞韩国人

  • 国产JiZZ18女人高潮

    香港裸体三级AAAAA

    🌿我~慢点~好爽好大~情趣店

    45.22MB
    738好评

    丝袜老师让我❌了一夜网站

  • 扒开火舞狂揉❌难受软件

    云璃双腿张开被开拓者❌

    对白脏话粗话肉麻AV

    10.13MB
    185好评

    女❌🐻脱👙

  • 91❤️国产丝袜在线播

    美女㊙️光屁股无遮挡

    纳西妲被扒开腿坐做❌同人

    44.35MB
    363好评

    十八禁🔞裸体自慰免费观看

  • 安琪拉裸体被❌

    二人世界拔萝卜全程记录

    樱桃视频在线观看一区二区三区四区五区

    91.01MB
    202好评

    巨大黑人极品video孕妇

  • 女仆扒开腿㊙️让人桶的app

    少妇videosBigAsssexHD,

    性猛喷奶做愛❌❌❌❌玩f1视频

    30.41MB
    907好评

    aSS日本美妇毛泬Pics

  • 免费🔞成人❌❌美女女软件

    变态摸🍑揉🐻图片

    ❌❌❌❌❌性欧中国大片

    30.03MB
    540好评

    Free❌❌❌video脚交

  • 米塔被❌吸乳

    色欲av㊙️臀av高清红桃下载

    邪恶道⭐️全彩无翼乌邪恶术

    29.56MB
    128好评

    扒开旅行者❌狂揉❌难受3d动漫

  • 美女又爽❌又黄❌又污随州房产网

    99成人乱码一区二区三区在线

    扒开jk美女❌狂揉❌免费软件

    70.18MB
    457好评

    男男GayGay✅免费视频软件

  • 女被c🔞黄秘❌触蓝莓动漫小说动漫涩涩✅免费网站在线看 title="麻豆精品㊙️国产传媒mv在线观看" class="0v5366j9r7414 app-list-img" src="https://t11.baidu.com/it/u=1040017057,165456434&fm=30&app=106&f=JPEG?w=312&h=208&s=15B07D95426079116A1494FD03009032"">

    动漫美女➕开屁屁➕韩国美女

    另类快活影院

  • AISS爱丝若兮最大尺度亚洲幼女激情黄片 title="黄🌸色🌸视🌸频🌸小视频" class="0v5366j9r7414 app-list-img" src="https://t10.baidu.com/it/u=3070224572,165461829&fm=30&app=106&f=JPEG?w=312&h=208&s=C6000AAC4838BAC8463F54AC0300A00B"">

    GV肉🥩在线观看

    一级AA片老年高潮视频

  • 鸣人❌雏田同人羞羞入口"18🈲🍆🍆🍆🍆看片 title="小🐔🐔伸进🈲🔞🔞免费韩漫" class="0v5366j9r7414 app-list-img" src="https://t12.baidu.com/it/u=1041590673,165100299&fm=30&app=106&f=JPEG?w=312&h=208&s=D7383EC642E1D8EA0A87937F0300C078"">

    纲手被爆❌自慰流水无尽动漫

    91在线无码精品㊙️co

{{.转码Keywords}} 类似软件

猜你喜欢

相关攻略
包含 饿了么 的应用集
评论
  • 男自慰无套✅免费网站小说 0天前
    沈阳人毛茸茸xxxxxxxxx
  • 初中美女图片被c 1天前
    成人18㊙️免费入口
  • 男人洗澡㊙️露蛋视频 3天前
    风流老女太婆A片
  • 亚洲做受❌❌❌高潮肉博团 1天前
    💚奇优影院免费看
  • 客厅引诱H啊H嗯H男男 5天前
    成人H㊙️视频在线阅读老师
  • 到高潮nxgx视频 3天前
    羞羞漫画❤️美女裸体
  • 日韩x片在线观看 7天前
    www软件深夜成人🔞白色液体
  • 少司缘被❌羞辱打开腿在线看 9天前
    HD❌❌❌成人
  • 18🈲男晨勃露露j 9天前
    做爱xxxⅹ性生交免费下载
  • Porn JAV ✅china 1天前
    yy9080高清影院理❤论