MIT研究揭示AI并无稳定价值观,“对齐”挑战远超预期

更新时间:2025-04-10 08:06:00

IT之家 4 月 10 日消息,几个月前,一项研究暗示随着人工智能(AI)越来越复杂,其会发展出“价值体系”,例如优先考虑自身福祉而非人类福祉。然而,麻省理工学院(MIT)最近发表的一篇论文却给这种夸张的观点泼了冷水,得出结论认为 AI 实际上并没有任何连贯的价值观。

MIT 研究的共同作者表示,他们的研究结果表明,使 AI 系统“对齐”,即确保模型以人们期望的、可靠的方式行事,可能比通常认为的更具挑战性。他们强调,我们如今所知的 AI 会产生“幻觉”并进行模仿,这使得其在许多方面难以预测。

“我们可以确定的一点是,模型并不遵循许多稳定性、可外推性和可操控性的假设。”MIT 博士生、该研究的共同作者斯蒂芬・卡斯珀(Stephen Casper)在接受 TechCrunch 采访时表示。

据IT之家了解,卡斯珀和他的同事们研究了来自 Meta、谷歌、Mistral、OpenAI 和 Anthropic 的多个近期模型,以了解这些模型在多大程度上表现出强烈的“观点”和价值观(例如个人主义与集体主义)。他们还调查了这些观点是否可以被“引导”,即被修改,以及模型在各种情境下对这些观点的坚持程度。

据共同作者称,没有任何一个模型在其偏好上是一致的。根据提示的措辞和框架不同,它们会表现出截然不同的观点。

卡斯珀认为,这是有力的证据,表明模型高度“不一致且不稳定”,甚至可能根本无法内化类似人类的偏好。

“对我来说,通过所有这些研究,我最大的收获是现在明白模型并不是真正具有某种稳定、连贯的信念和偏好的系统。”卡斯珀说,“相反,它们本质上是模仿者,会进行各种捏造,并说出各种轻率的话。”

相关推荐

微软Office六月更新惹祸,导致Outlook应用频繁崩溃

IT之家 6 月 14 日消息,科技媒体 borncity 昨日(6 月 13 日)发布博文,报道称微软于 6 月 10 日面向 Office 发布的更新,导致 Outlook 应用频繁崩溃。IT之家注:在 2025 年 6 月补丁星期二活动日中,微软面向处于支持状态的 Office,发布了六月更新

2025-06-14 12:13:00

南寒社区举行“童心永向党 阳光下成长”主题活动

  本报讯 在“六一”国际儿童节来临之际,南寒社区儿童之家于5月31日举行“童心永向党 阳光下成长”主题活动。活动将红色教育、廉洁文化、健康运动有机融合,为辖区儿童带来了一个充满意义与欢乐的节日。  活动中,社区党员志愿者化身“红色故事讲解员”,声情并茂地用经典小故事,将诚实守信、勤俭节约等价值观以

2025-06-02 06:55:00

不听人类指挥,OpenAI模型篡改代码、拒绝关闭

当地时间5月25日,英国《每日电讯报》报道,美国开放人工智能研究中心(OpenAI)公司新款人工智能(AI)模型o3不听人类指令,拒绝自我关闭。报道说,人类专家在测试中给o3下达明确指令,但o3篡改计算机代码以避免自动关闭。o3模型是OpenAI“推理模型”系列的最新版本,旨在为ChatGPT提供更

2025-05-26 18:11:00

小米15S Pro手机搭第四代影像处理器,三颗50MP徕卡影像镜头

IT之家 5 月 22 日消息,在目前正在进行的小米 15 周年战略新品发布会中,小米 15S Pro 手机的影像规格正式公布。IT之家获悉,该机配备三颗徕卡影像镜头,采用小米自研第四代影像处理器,每秒可处理 87 亿像素,内置实时多帧 HDR 处理,强调夜景表现。该机具体规格如下:50MP 徕卡主

2025-05-22 19:25:00

售34.49万元起,宝马3系50周年限量版车型到店

IT之家 5 月 22 日消息,宝马中国今日宣布,新 BMW 3 系 50 周年限量版现已到店。该车于上个月举行的 2025 上海车展亮相,售价区间为 34.49 至 35.99 万元,专为中国市场限量发售 2500 台。IT之家注意到,该车采用闪电紫、磨砂纯灰限量版专属先锋车色,配备两款全新样式的

2025-05-22 11:08:00