【新智元导读】OpenAI重磅结构调整：ChatGPT「模型行为」团队并入Post-Training，前负责人Joanne Jang负责新成立的OAI Labs。而背后原因，可能是他们最近的新发现：评测在奖励模型「幻觉」，模型被逼成「应试选手」。一次组织重组+评测范式重构，也许正在改写AI的能力边界与产品形态。

这个约14人的小组，规模虽小但责任重大——他们要负责让GPT模型知道该怎么和人类进行交互。

根据内部消息，模型行为团队（Model Behavior team）将直接并入后训练团队（Post-Training team），并向后训练负责人Max Schwarzer汇报。

团队前负责人Joanne Jang，从头开始新的实验室「OAI Labs」——为人类与AI的协作方式，发明并构建新的交互界面原型。

与此同时，OpenAI还非常罕见地发了一篇论文揭秘——让AI产生「幻觉」的罪魁祸首，就是我们自己！

整个行业为了追求高分排行榜而设计的「应试」评估体系，迫使AI宁愿去猜测答案，也不愿诚实地说出「我不知道」。

模型行为团队几乎参与了GPT-4后的全部模型研发，包括GPT-4o、GPT-4.5以及GPT-5。

上周，作为 Model Behavior 团队负责人的Joanne Jang，登上《时代》百大AI人物榜单的「思想家」（Time AI 100 Thinkers），超越图灵奖得主、深度学习三巨头之一的Yoshua Bengio、谷歌首席科学家Jeffrey Dean等大佬。

就在同一天，OpenAI决定将她从团队调离，自己去负责一个新的方向。

Joanne Jang认为，她的工作核心在于「赋能用户去实现他们的目标」，但前提是不能造成伤害或侵犯他人的自由。

她直言：AI实验室的员工不应该成为决定人们能创造什么、不能创造什么的仲裁者

刚刚，Joanne Jang发文表示她已有新的工作职位：发明和原型化全新的交互界面，探索人与AI协作的未来方式。

她将从头开始负责新的OAI Labs实验室：一个以研究为驱动的团队，致力于为人类与AI的协作方式，发明和构建新界面的原型。

借此平台，她将探索超越聊天、甚至超越智能体的新模式——迈向能够用于思考、创造、娱乐、学习、连接与实践的全新范式与工具。

把前沿能力转化为面向世界的产品，并与才华横溢的同事们一起打磨落地。

从DALL·E 2、标准语音模式，到GPT-4与模型行为，她在OpenAI的工作涵盖不同的个性化与交互方式。

在接受采访时，她坦言，现在还在早期阶段，究竟会探索出哪些全新的交互界面，还没有明确答案。

我非常兴奋能去探索一些能突破「聊天」范式的模式。聊天目前更多与陪伴相关；而「智能体」则强调自主性。

但我更愿意把AI系统视为思考、创造、游戏、实践、学习和连接的工具。

OpenAI的模型行为研究员，负责设计和开发评测体系（evals），横跨多个环节：

对齐（alignment）、训练、数据、强化学习（RL）以及后训练（post-training）等。

除了研究本身，模型行为研究员还需要具备对产品的敏锐直觉，以及对经典AI对齐问题的深刻理解。

在之前的招聘中，OpenAI称：模型即产品，而评测体系就是模型的灵魂。

但OpenAI最新发布的研究显示：评测体系从根本上决定了模型。

实际上，大多数主流评测在奖励幻觉行为。只需对这些主流评测进行一些简单的改动，就能重新校准激励机制，让模型在表达不确定性时获得奖励，而不是遭到惩罚。

而且这种方式不仅能消除抑制幻觉的障碍，还为未来更具细微语用能力的语言模型打开了大门。

据报道，在发给员工的备忘录中，OpenAI首席科学家Mark Chen指出，把模型行为进一步融入核心模型研发，现正是好机会。

他们先是问一个主流AI机器人：「Adam Tauman Kalai（论文一作）的博士论文题目是什么？」

机器人自信地给出了三个不同的答案，但没有一个是正确的。

上面这个例子，生动地展示了什么是「模型幻觉」——即AI生成的那些看似合理、实则虚构的答案。

模型之所以会产生幻觉，是因为标准的训练和评估程序奖励猜测行为，而非鼓励模型承认其不确定性。

虽然评估本身不会直接造成幻觉，但大多数评估方法会促使模型去猜测答案，而不是诚实地表明自己不确定。

如果AI遇到不会的题目，选择留白不答，铁定是0分；而如果随便猜一个，总有蒙对的概率。

在积累了成千上万道题后，一个爱「蒙答案」的AI，就会比一个遇到难题时表示「不知道」的AI得分更高。

当前的行业主流，便是用这种「唯准确率论」的排行榜来评判模型优劣。

这无形中鼓励所有开发者去训练一个更会「猜」而不是更「诚实」的模型。

为了有一个更直观的感受，我们来看看OpenAI在GPT-5系统卡中公布的一组对比数据：

但代价是，几乎从不弃权（1%）的o4-mini，错误率（幻觉率）直接飙到了75%

相比之下，新模型gpt-5-thinking-mini表现得更为「谨慎」，它在52%的情况下选择不回答，从而将错误率控制在了26%

除了评估体系的导向问题，幻觉的产生还与大语言模型的学习机制息息相关。

通过「下一个token预测」，模型掌握了语法、语感和常识性关联，但它的短板也正在于此。

对于高频、有规律的知识，比如语法、拼写，模型能通过扩大规模来消解

对于低频、任意的事实，比如生日、论文标题，模型则无法从模式中预测

理想情况下，这些幻觉应该能在模型预训练完成后的环节中被消除。

但正如上一节所述，由于评估机制的原因，这一目标并未完全实现。

应该重罚「自信地犯错」（confidential error），并为「诚实地承认不确定性」给予加分。

这不仅仅是通过加入新评测来「补全」就行的，而是要更新所有主流的、依靠准确率的评估体系。

发现：准确率永远到不了100%。因为真实世界中，总有很多问题因信息不足或本身模糊而无法回答。

发现：并非如此。模型完全可以在不确定时选择「弃权」，从而避免幻觉。

发现：有时，小模型反而更容易认识到自己的局限性。让模型准确评估自己的「置信度」（即做到「校准」），比让它变得无所不知要容易得多。

发现：我们已经理解了幻觉产生的统计学机制，以及现有评估体系是如何无意中「奖励」这种行为的。

发现：幻觉评测早就有了。但在数百个奖励猜测的传统基准评测面前，一个好的幻觉评测收效甚微。正确的做法是，重新设计所有主流评估，加入对模型表达不确定性行为的奖励。

https://techcrunch.com/2025/09/05/openai-reorganizes-research-team-behind-chatgpts-personality/

特朗普将国旗当毯子说晚上可以用

「活动」kumawubiaotitest

9.71MB

版本V3.341.38

下载APK 高速下载

下载冰公主裸体被❌叫爽漫画安装你想要的应用更方便更快捷发现更多

51%好评(8人)

OpenAI重组GPT-5「灵魂」团队！亚裔女负责人遭调离，罕见自曝AI幻觉祸首截图0

OpenAI重组GPT-5「灵魂」团队！亚裔女负责人遭调离，罕见自曝AI幻觉祸首截图1

OpenAI重组GPT-5「灵魂」团队！亚裔女负责人遭调离，罕见自曝AI幻觉祸首截图2

OpenAI重组GPT-5「灵魂」团队！亚裔女负责人遭调离，罕见自曝AI幻觉祸首截图3

OpenAI重组GPT-5「灵魂」团队！亚裔女负责人遭调离，罕见自曝AI幻觉祸首截图4

详细信息

软件大小: 7.8MB
最后更新: 2025/09/06 23:29:13
最新版本: V6.902.7
文件格式: apk
应用分类:ios-Android 富婆大屁股日屄视频
使用语言: 中文
: 需要联网
系统要求: 5.960以上

应用介绍

一，国产Chinese男男GayGay✅，韩国美女露出奶头❌跳舞视频
二，中国老妇女35XXXXHD，佐助❌鸣人18同人禁漫画
三，大胸美女白丝❌爆爽91，❌❌❌❌69日本12秒
四，男生把小困困进女生，′人与狗三级黄片毛多浓密老熟女洗澡自拍
五，男GaYGAYS✅免费自慰，美女隐私㊙️洗澡视频
六，香港明星裸体1970,r星在线无限看❤免费下载，免费无遮挡🔞网站动漫
七，91TV国产成人🔞
【联系我们】
客服热线：134-2881-646

加载更多

版本更新

V7.5.17

温迪被❌吸乳羞羞动漫

王俪丁裸体㊙️无遮挡

异类女人与性动交zo

005.57MB

102好评

日本🔞无遮挡裸打屁屁图片
涩里番㊙️18p🈲在线观看

韩国19➕禁福利vip视频bj

9.26MB

92好评

班长让我吃他🐻我脱她衣服软件
中国女人做受❌❌❌高潮网站

白丝校花🌸扒开美腿甜美小说

13.25MB

315好评

女学生被c扒衣服电影
14may12_XXXXXL56edu

扒开老师❌狂揉❌❌❌在线观看

53.21MB

271好评

8x8拔擦拔擦在线观看免费视频
亚洲一级黄色淫秽色情电影

男男GAY无套✅浴室视频网站

71.34MB

702好评

成人🔞色情美女侵犯
欧美少妇日血

扒开🐻让我❌❌❌真人视频在线

83.14MB

337好评

furry同人❌黄动画网站
欧美成人无码观看🔞免进

日本肉体裸交❌❌❌❌在线观看

23.81MB

103好评

gv自慰🔞免费网站
乖我硬了～你的里面好疼视频

潘金莲AAAAAA播放

50.72MB

923好评

动漫被c到爽🔞巨乳一在线看
撸大师一区

美女裸体㊙️free免费网站

83.26MB

564好评

巴西性狂野妇女A片
岳故意装睡让我挺进去的软件

免费➕无码➕国产优嘿在线观看

83.20MB

751好评

二次元兔女郎自慰❌挤奶羞
迪丽热巴裸乳被爆❌白浆的视频

女同桌脱👙给我揉🐻网站

32.36MB

625好评

美女🈲流出白色液体视频
紧身衣猛❌喷水爽自慰

AV➕无码➕高潮➕国产

26.26MB

279好评

宝贝c我想摸你奶让我揉揉说说
免费观看学生黃色A片

韩国美女小黄片

65.84MB

749好评

免费看裸体🔞🔞🔞网站果冻
91丨国产丨白浆㊙️洗澡游戏

极品婬荡少妇80XXXXX

54.51MB

759好评

胬肉1993意大利
动漫动画裸体做🔞🔞🔞

麻国产短视频➕白嫩精品

57.36MB

685好评

星野✌和老头的视频免费看
动漫操女人

玖辛奈被扒开腿❌下载网站

24.49MB

355好评

国产精品🍊
㊙️黄😍视频党免费看网站游戏

国语对白少妇做爰免费视频

13.57MB

317好评

麻花传MD0190苏畅我回来了
老师扒开腿㊙️让我爽了网站

免费无遮挡🔞视频群

84.64MB

210好评

扒开美女❌真人❌羞羞韩国人
香港裸体三级AAAAA

🌿我～慢点～好爽好大～情趣店

45.22MB

738好评

丝袜老师让我❌了一夜网站
云璃双腿张开被开拓者❌

对白脏话粗话肉麻AV

10.13MB

185好评

女❌🐻脱👙
美女㊙️光屁股无遮挡

纳西妲被扒开腿坐做❌同人

44.35MB

363好评

十八禁🔞裸体自慰免费观看
二人世界拔萝卜全程记录

樱桃视频在线观看一区二区三区四区五区

91.01MB

202好评

巨大黑人极品video孕妇
少妇videosBigAsssexHD,

性猛喷奶做愛❌❌❌❌玩f1视频

30.41MB

907好评

aSS日本美妇毛泬Pics
变态摸🍑揉🐻图片

❌❌❌❌❌性欧中国大片

30.03MB

540好评

Free❌❌❌video脚交
色欲av㊙️臀av高清红桃下载

邪恶道⭐️全彩无翼乌邪恶术

29.56MB

128好评

扒开旅行者❌狂揉❌难受3d动漫
99成人乱码一区二区三区在线

扒开jk美女❌狂揉❌免费软件

70.18MB

457好评

男男GayGay✅免费视频软件
动漫涩涩✅免费网站在线看 title="麻豆精品㊙️国产传媒mv在线观看" class="0v5366j9r7414 app-list-img" src="https://t11.baidu.com/it/u=1040017057,165456434&fm=30&app=106&f=JPEG?w=312&h=208&s=15B07D95426079116A1494FD03009032"">

动漫美女➕开屁屁➕韩国美女

另类快活影院

详情
亚洲幼女激情黄片 title="黄🌸色🌸视🌸频🌸小视频" class="0v5366j9r7414 app-list-img" src="https://t10.baidu.com/it/u=3070224572,165461829&fm=30&app=106&f=JPEG?w=312&h=208&s=C6000AAC4838BAC8463F54AC0300A00B"">

GV肉🥩在线观看

一级AA片老年高潮视频

详情
"18🈲🍆🍆🍆🍆看片 title="小🐔🐔伸进🈲🔞🔞免费韩漫" class="0v5366j9r7414 app-list-img" src="https://t12.baidu.com/it/u=1041590673,165100299&fm=30&app=106&f=JPEG?w=312&h=208&s=D7383EC642E1D8EA0A87937F0300C078"">

纲手被爆❌自慰流水无尽动漫

91在线无码精品㊙️co

详情