MIT 研究揭示 AI 并无稳定价值观,“对齐”挑战远超预期

2025年04月10日09:00:36 科学 1478

it之家 4 月 10 日消息,几个月前,一项研究暗示随着人工智能(ai)越来越复杂,其会发展出“价值体系”,例如优先考虑自身福祉而非人类福祉。然而,麻省理工学院(mit)最近发表的一篇论文却给这种夸张的观点泼了冷水,得出结论认为 ai 实际上并没有任何连贯的价值观。

MIT 研究揭示 AI 并无稳定价值观,“对齐”挑战远超预期 - 天天要闻

mit 研究的共同作者表示,他们的研究结果表明,使 ai 系统“对齐”,即确保模型以人们期望的、可靠的方式行事,可能比通常认为的更具挑战性。他们强调,我们如今所知的 ai 会产生“幻觉”并进行模仿,这使得其在许多方面难以预测。

“我们可以确定的一点是,模型并不遵循许多稳定性、可外推性和可操控性的假设。”mit 博士生、该研究的共同作者斯蒂芬・卡斯珀(stephen casper)在接受 techcrunch 采访时表示。

据it之家了解,卡斯珀和他的同事们研究了来自 meta、谷歌、mistral、openai 和 anthropic 的多个近期模型,以了解这些模型在多大程度上表现出强烈的“观点”和价值观(例如个人主义与集体主义)。他们还调查了这些观点是否可以被“引导”,即被修改,以及模型在各种情境下对这些观点的坚持程度。

据共同作者称,没有任何一个模型在其偏好上是一致的。根据提示的措辞和框架不同,它们会表现出截然不同的观点。

卡斯珀认为,这是有力的证据,表明模型高度“不一致且不稳定”,甚至可能根本无法内化类似人类的偏好。

“对我来说,通过所有这些研究,我最大的收获是现在明白模型并不是真正具有某种稳定、连贯的信念和偏好的系统。”卡斯珀说,“相反,它们本质上是模仿者,会进行各种捏造,并说出各种轻率的话。”

科学分类资讯推荐

走在开放前沿,它们靠什么成为全球资源“强磁场”? - 天天要闻

走在开放前沿,它们靠什么成为全球资源“强磁场”?

每经编辑:杨欢图片来源:成都东部新区供图从地面到天空,一座座拔地而起的机场正悄然改写城市命运。全球化加速推进,越来越多城市加码入局枢纽机场竞争,期待在加速联通世界中重塑经济地理与城市竞争力。一个普遍共识是,更高效便利的航空运输会成为带动贸易发展、人才流动、资源共享的全新动力源,进而创造面向未来发展的...
联想“稀土外壳”争议:美国能否靠回收提炼打破中国稀土封锁? - 天天要闻

联想“稀土外壳”争议:美国能否靠回收提炼打破中国稀土封锁?

背景:稀土出口管制下的“变相出口”疑云近期,联想推出的“稀土镁合金”笔记本电脑外壳引发舆论争议。据网友爆料,其外壳中使用的钇元素属于中国严格管控的7类中重稀土之一。尽管中国已对稀土出口实施限制,但联想通过将稀土加工成合金材料并嵌入笔记本电脑
欧盟砸5亿欧元“抢人”,马克龙:欧洲要做科学家的避风港 - 天天要闻

欧盟砸5亿欧元“抢人”,马克龙:欧洲要做科学家的避风港

当地时间5月5日,一场名为“为了科学 选择欧洲”的大会在法国巴黎召开。法国与欧盟委员会在会上宣布,在美国特朗普政府减少对科研领域的资助之际,欧盟将设立一项总值5亿欧元的科研激励计划,吸引外国的科研人员,特别是来自美国的科研人员前来工作。
木星发现巨型熔岩湖?朱诺号探测器传回最新发现 - 天天要闻

木星发现巨型熔岩湖?朱诺号探测器传回最新发现

木星北极的气旋群像一群诡异的舞者,以超过160公里的时速相互碰撞;木卫一的熔岩湖在冰冷外壳下暗流涌动,炽热岩浆随时可能喷薄而出——这些堪比科幻大片的场景,正是NASA朱诺号探测器最新传回的太阳系真相。
哈尔滨市第44届“爱鸟周”活动启幕 - 天天要闻

哈尔滨市第44届“爱鸟周”活动启幕

来源:【冰城+】5月5日,以“清除鸟网 密织法网 让鸟儿自由飞翔”为主题的哈尔滨市第44届“爱鸟周”活动启动仪式在北方森林动物园百鸟广场举行。本次活动由市林业和草原局、公安局食药环侦支队、北方森林动物园等单位联合举办。
比不读书更糟!日本一教授10年的研究结果显示,玩手机恐致发育停滞 - 天天要闻

比不读书更糟!日本一教授10年的研究结果显示,玩手机恐致发育停滞

近日,日本东北大学加龄医学研究所教授川岛隆太的一项研究显示,过度使用手机与学生学业成绩下滑、脑部发育停滞有显著关联。(日本一教授10年的研究结果显示,玩手机恐致发育停滞。)川岛从2010年开始,对日本宫城县仙台市约7万名中小学生进行长达10年的追踪调查。他指出,每天使用屏幕(包括电视、手机)的时间超过一个小...
中国医学科学院鲁帅尧/王佑春/孙强明研究设计CHIKV mRNA疫苗 - 天天要闻

中国医学科学院鲁帅尧/王佑春/孙强明研究设计CHIKV mRNA疫苗

点击上方“Vaccine前研”,关注最新疫苗动态iNature随着基孔肯尼亚病毒(CHIKV)的广泛传播,对更有效、保护性更强的疫苗的需求越来越大。2025年3月28日,中国医学科学院鲁帅尧、王佑春、孙强明共同通讯在Signal Transduction and Tatgeted Therapy上在线发表题为“CHIKV mRNA vaccines encod
世界上第一台将人脑与硅相结合的计算机问世了 - 天天要闻

世界上第一台将人脑与硅相结合的计算机问世了

CL1计算机是世界上第一台将人类神经元与硅芯片相结合的计算机。它可以在六个月后到期之前用于疾病建模和药物发现。一种将普通硅基硬件与人类神经元相结合的新型计算机现已上市。CL1由总部位于墨尔本的初创公司Cortical Labs于3月2日发布,据该公司网站介绍,它是“世界上第一台可部署代码的生物计算机”。代表们说,这个鞋...