MIT研究揭示AI并无稳定价值观,“对齐”挑战远超预期

更新时间:2025-04-10 08:06:00

IT之家 4 月 10 日消息,几个月前,一项研究暗示随着人工智能(AI)越来越复杂,其会发展出“价值体系”,例如优先考虑自身福祉而非人类福祉。然而,麻省理工学院(MIT)最近发表的一篇论文却给这种夸张的观点泼了冷水,得出结论认为 AI 实际上并没有任何连贯的价值观。

MIT 研究的共同作者表示,他们的研究结果表明,使 AI 系统“对齐”,即确保模型以人们期望的、可靠的方式行事,可能比通常认为的更具挑战性。他们强调,我们如今所知的 AI 会产生“幻觉”并进行模仿,这使得其在许多方面难以预测。

“我们可以确定的一点是,模型并不遵循许多稳定性、可外推性和可操控性的假设。”MIT 博士生、该研究的共同作者斯蒂芬・卡斯珀(Stephen Casper)在接受 TechCrunch 采访时表示。

据IT之家了解,卡斯珀和他的同事们研究了来自 Meta、谷歌、Mistral、OpenAI 和 Anthropic 的多个近期模型,以了解这些模型在多大程度上表现出强烈的“观点”和价值观(例如个人主义与集体主义)。他们还调查了这些观点是否可以被“引导”,即被修改,以及模型在各种情境下对这些观点的坚持程度。

据共同作者称,没有任何一个模型在其偏好上是一致的。根据提示的措辞和框架不同,它们会表现出截然不同的观点。

卡斯珀认为,这是有力的证据,表明模型高度“不一致且不稳定”,甚至可能根本无法内化类似人类的偏好。

“对我来说,通过所有这些研究,我最大的收获是现在明白模型并不是真正具有某种稳定、连贯的信念和偏好的系统。”卡斯珀说,“相反,它们本质上是模仿者,会进行各种捏造,并说出各种轻率的话。”

相关推荐

“最美沈铁人”金东哲退休后续写助残暖心故事

29日,二一九公园内春意盎然,欢声笑语此起彼伏。刚刚退休不久的“最美沈铁人”金东哲,以满腔热忱,带领“阳光之家”的残疾人群体及他们的家人一同开启春日游园之旅,并为他们拍照留念,给残疾家庭送去温暖与欢乐。金东哲曾是沈铁鞍山车务段鞍山站客运值班员。在职期间,他凭借热情细致的服务和无私奉献的精神,荣获“最

2025-04-29 18:20:00

行业出题,政企发力!广州琶洲算法大赛高校巡回赛热度持续提升

近日,琶洲算法大赛高校巡回赛第二站在华南理工大学(大学城校区)圆满落下帷幕。4月26日,记者从广州海珠相关部门获悉,琶洲算法大赛历经连续举办三届后,已经成为国内外算法领域从业者展示算法实力的舞台。为进一步构建“大赛+巡回赛”全年赛事矩阵,去年10月份以来,海珠区首创“一校一赛”的定制化办赛模式,推出

2025-04-26 16:13:00

大模型下半场,百度再次发起进攻

澎湃新闻记者 宋一聪2025年4月25日,Create2025百度AI开发者大会在武汉举办。当李彦宏宣布文心大模型4.5 Turbo和文心大模型X1 Turbo发布后,随即跟上的一系列AI新应用和新服务,证明了如今的百度,在AI领域已经是模型和应用双向出击,其所图并不仅仅是算法或大模型本身,更是在“

2025-04-26 00:04:00

买台机器人“保姆”?再等等

【科学·近距离】光明日报记者 詹媛春日的北京,一场充满未来感的马拉松赛事吸引了众人的目光——全球首个人形机器人半程马拉松赛在21.0975公里的赛道上展开角逐,20支机器人队伍参赛。无论这些钢铁之躯是蹒跚学步还是稳步疾行,必须承认的事实是:它们的每一步都闪烁着人类智慧的火花。不妨先来回溯一下人类近半

2025-04-24 06:29:00

富士通、理研推出256超导量子比特计算机,千量子比特款明年见

IT之家 4 月 22 日消息,富士通今日宣布,该企业同日本理化学研究所(IT之家注:即理研、RIKEN)联合开发了一款世界领先的 256 量子比特的超导量子计算机,较上一代 64 量子比特项目规模扩展四倍。合作双方计划从本财季开始向全球研究机构和企业提供基于该新型超导计算机的混合量子计算服务,这意

2025-04-22 18:22:00