MIT 研究揭示 AI 并无稳定价值观,“对齐”挑战远超预期

2025年04月10日09:00:36 科学 1478

it之家 4 月 10 日消息,几个月前,一项研究暗示随着人工智能(ai)越来越复杂,其会发展出“价值体系”,例如优先考虑自身福祉而非人类福祉。然而,麻省理工学院(mit)最近发表的一篇论文却给这种夸张的观点泼了冷水,得出结论认为 ai 实际上并没有任何连贯的价值观。

MIT 研究揭示 AI 并无稳定价值观,“对齐”挑战远超预期 - 天天要闻

mit 研究的共同作者表示,他们的研究结果表明,使 ai 系统“对齐”,即确保模型以人们期望的、可靠的方式行事,可能比通常认为的更具挑战性。他们强调,我们如今所知的 ai 会产生“幻觉”并进行模仿,这使得其在许多方面难以预测。

“我们可以确定的一点是,模型并不遵循许多稳定性、可外推性和可操控性的假设。”mit 博士生、该研究的共同作者斯蒂芬・卡斯珀(stephen casper)在接受 techcrunch 采访时表示。

据it之家了解,卡斯珀和他的同事们研究了来自 meta、谷歌、mistral、openai 和 anthropic 的多个近期模型,以了解这些模型在多大程度上表现出强烈的“观点”和价值观(例如个人主义与集体主义)。他们还调查了这些观点是否可以被“引导”,即被修改,以及模型在各种情境下对这些观点的坚持程度。

据共同作者称,没有任何一个模型在其偏好上是一致的。根据提示的措辞和框架不同,它们会表现出截然不同的观点。

卡斯珀认为,这是有力的证据,表明模型高度“不一致且不稳定”,甚至可能根本无法内化类似人类的偏好。

“对我来说,通过所有这些研究,我最大的收获是现在明白模型并不是真正具有某种稳定、连贯的信念和偏好的系统。”卡斯珀说,“相反,它们本质上是模仿者,会进行各种捏造,并说出各种轻率的话。”

科学分类资讯推荐

中国交付全球最大“人造太阳”重要部件 - 天天要闻

中国交付全球最大“人造太阳”重要部件

近日,全球最大“人造太阳”国际热核聚变实验堆(ITER)计划磁体馈线采购包项目迎来关键节点,其最后一套校正场线圈内馈线部件在合肥竣工,并交付起运位于法国的ITER现场。这标志着ITER磁体馈线系统中所有超大部件的研制顺利完成。ITER磁体馈线系统由中国科学院合肥物质科学研究院等离子体物理研究所研制,被称为ITER磁体系...
张振丰调研温州学研究联合会 构建中国学视野下的温州学研究体系 - 天天要闻

张振丰调研温州学研究联合会 构建中国学视野下的温州学研究体系

4月13日,副省长、市委书记张振丰在温州学研究联合会调研时强调,要深入学习贯彻习近平文化思想和习近平总书记考察浙江重要讲话精神,坚持“立足温州、研究温州、服务温州”,深化时间维度、放大空间维度,贯通历史研究温州、跳出温州研究温州,努力打造温州建设高水平文化强市的重要窗口、具有全国影响力的地方学术研究的...
土拨鼠等动植物不得携带入境!关于国门生物安全,你要知道这些 - 天天要闻

土拨鼠等动植物不得携带入境!关于国门生物安全,你要知道这些

极目新闻记者 张秀娟通讯员 赵梦洁 黄晓彧 林敏“小朋友们,外来入侵物种包括哪些呢?”“在咱们出国旅游前,需注意哪些问题呢?”4月12日,在第十个全民国家安全教育日来临之际,武汉海关在武汉天河国际机场开展了一场别开生面的“海关开放日”活动。15名小学生化身“国门小卫士”,零距离体验、参与海关全民国家安全教育...
月球上跳一跳,轻松打破跳高世界纪录!这个展会,解密引力奥秘 - 天天要闻

月球上跳一跳,轻松打破跳高世界纪录!这个展会,解密引力奥秘

顶端新闻记者 杨逍 文 时硕 图如果你向往星辰宇宙,那你是否幻想过在其他星球上跳跃?在本次国防展的“星球重力”互动体验机前,你每次的纵身一跃,都会化身成屏幕中身穿宇航员服的小人,来到月球、金星、火星、火卫二、土卫一等星体上,屏幕的上方记录着你的跳跃高度。在月球,你轻轻一跃就能达到3米高度,轻松打破2.45米...
4月13日石家庄强风显著增强的原因 - 天天要闻

4月13日石家庄强风显著增强的原因

4月13日石家庄强风显著增强的原因,是多重气象条件和地理因素共同作用的结果。根据气象监测和专家分析,此次强风具有以下关键成因:一、极端天气系统的叠加效应1.
神十九乘组“太空出差”倒计时:各项空间科学实(试)验稳步推进 - 天天要闻

神十九乘组“太空出差”倒计时:各项空间科学实(试)验稳步推进

IT之家 4 月 13 日消息,据央视网报道,神舟十九号航天员乘组的“太空出差”之旅即将进入倒计时。上周,神十九乘组稳步推进各项空间科学实(试)验,在开展站内环境监测、设备检查维护等工作同时,积极开展健康维护。神十九乘组利用脑电设备开展了多项实验的测试工作,地面科研人员将利用获取的数据探究重力对视觉运动信息...
感受活力丨机器人正在进化中……这样的“生活搭子”,你喜欢吗? - 天天要闻

感受活力丨机器人正在进化中……这样的“生活搭子”,你喜欢吗?

模仿人类奔跑、跳跃、空翻,像人一样说话、思考甚至察言观色。这不是科幻电影对未来的虚构,而是2025中国机器人产业阔步向前的现实。小时候的你,是不是也曾畅想过:家里有一个机器人,能买菜、做饭、铺床、扫地,帮你干农活,还可以照顾家里老人……时至今日,这些“天马行空”的想象,正在变成现实。“12点了,您该吃药了...