MIT 研究揭示 AI 並無穩定價值觀,「對齊」挑戰遠超預期

2025年04月10日09:00:36 科學 1478

it之家 4 月 10 日消息,幾個月前,一項研究暗示隨着人工智能(ai)越來越複雜,其會發展出「價值體系」,例如優先考慮自身福祉而非人類福祉。然而,麻省理工學院(mit)最近發表的一篇論文卻給這種誇張的觀點潑了冷水,得出結論認為 ai 實際上並沒有任何連貫的價值觀。

MIT 研究揭示 AI 並無穩定價值觀,「對齊」挑戰遠超預期 - 天天要聞

mit 研究的共同作者表示,他們的研究結果表明,使 ai 系統「對齊」,即確保模型以人們期望的、可靠的方式行事,可能比通常認為的更具挑戰性。他們強調,我們如今所知的 ai 會產生「幻覺」並進行模仿,這使得其在許多方面難以預測。

「我們可以確定的一點是,模型並不遵循許多穩定性、可外推性和可操控性的假設。」mit 博士生、該研究的共同作者斯蒂芬・卡斯珀(stephen casper)在接受 techcrunch 採訪時表示。

據it之家了解,卡斯珀和他的同事們研究了來自 meta、谷歌、mistral、openai 和 anthropic 的多個近期模型,以了解這些模型在多大程度上表現出強烈的「觀點」和價值觀(例如個人主義與集體主義)。他們還調查了這些觀點是否可以被「引導」,即被修改,以及模型在各種情境下對這些觀點的堅持程度。

據共同作者稱,沒有任何一個模型在其偏好上是一致的。根據提示的措辭和框架不同,它們會表現出截然不同的觀點。

卡斯珀認為,這是有力的證據,表明模型高度「不一致且不穩定」,甚至可能根本無法內化類似人類的偏好。

「對我來說,通過所有這些研究,我最大的收穫是現在明白模型並不是真正具有某種穩定、連貫的信念和偏好的系統。」卡斯珀說,「相反,它們本質上是模仿者,會進行各種捏造,並說出各種輕率的話。」

科學分類資訊推薦

中國交付全球最大「人造太陽」重要部件 - 天天要聞

中國交付全球最大「人造太陽」重要部件

近日,全球最大「人造太陽」國際熱核聚變實驗堆(ITER)計劃磁體饋線採購包項目迎來關鍵節點,其最後一套校正場線圈內饋線部件在合肥竣工,並交付起運位於法國的ITER現場。這標誌着ITER磁體饋線系統中所有超大部件的研製順利完成。ITER磁體饋線系統由中國科學院合肥物質科學研究院等離子體物理研究所研製,被稱為ITER磁體系...
張振豐調研溫州學研究聯合會 構建中國學視野下的溫州學研究體系 - 天天要聞

張振豐調研溫州學研究聯合會 構建中國學視野下的溫州學研究體系

4月13日,副省長、市委書記張振豐在溫州學研究聯合會調研時強調,要深入學習貫徹習近平文化思想和習近平總書記考察浙江重要講話精神,堅持「立足溫州、研究溫州、服務溫州」,深化時間維度、放大空間維度,貫通歷史研究溫州、跳出溫州研究溫州,努力打造溫州建設高水平文化強市的重要窗口、具有全國影響力的地方學術研究的...
土撥鼠等動植物不得攜帶入境!關於國門生物安全,你要知道這些 - 天天要聞

土撥鼠等動植物不得攜帶入境!關於國門生物安全,你要知道這些

極目新聞記者 張秀娟通訊員 趙夢潔 黃曉彧 林敏「小朋友們,外來入侵物種包括哪些呢?」「在咱們出國旅遊前,需注意哪些問題呢?」4月12日,在第十個全民國家安全教育日來臨之際,武漢海關在武漢天河國際機場開展了一場別開生面的「海關開放日」活動。15名小學生化身「國門小衛士」,零距離體驗、參與海關全民國家安全教育...
月球上跳一跳,輕鬆打破跳高世界紀錄!這個展會,解密引力奧秘 - 天天要聞

月球上跳一跳,輕鬆打破跳高世界紀錄!這個展會,解密引力奧秘

頂端新聞記者 楊逍 文 時碩 圖如果你嚮往星辰宇宙,那你是否幻想過在其他星球上跳躍?在本次國防展的「星球重力」互動體驗機前,你每次的縱身一躍,都會化身成屏幕中身穿宇航員服的小人,來到月球、金星、火星、火衛二、土衛一等星體上,屏幕的上方記錄著你的跳躍高度。在月球,你輕輕一躍就能達到3米高度,輕鬆打破2.45米...
4月13日石家莊強風顯著增強的原因 - 天天要聞

4月13日石家莊強風顯著增強的原因

4月13日石家莊強風顯著增強的原因,是多重氣象條件和地理因素共同作用的結果。根據氣象監測和專家分析,此次強風具有以下關鍵成因:一、極端天氣系統的疊加效應1.
神十九乘組「太空出差」倒計時:各項空間科學實(試)驗穩步推進 - 天天要聞

神十九乘組「太空出差」倒計時:各項空間科學實(試)驗穩步推進

IT之家 4 月 13 日消息,據央視網報道,神舟十九號航天員乘組的「太空出差」之旅即將進入倒計時。上周,神十九乘組穩步推進各項空間科學實(試)驗,在開展站內環境監測、設備檢查維護等工作同時,積極開展健康維護。神十九乘組利用腦電設備開展了多項實驗的測試工作,地面科研人員將利用獲取的數據探究重力對視覺運動信息...
感受活力丨機械人正在進化中……這樣的「生活搭子」,你喜歡嗎? - 天天要聞

感受活力丨機械人正在進化中……這樣的「生活搭子」,你喜歡嗎?

模仿人類奔跑、跳躍、空翻,像人一樣說話、思考甚至察言觀色。這不是科幻電影對未來的虛構,而是2025中國機械人產業闊步向前的現實。小時候的你,是不是也曾暢想過:家裡有一個機械人,能買菜、做飯、鋪床、掃地,幫你干農活,還可以照顧家裡老人……時至今日,這些「天馬行空」的想像,正在變成現實。「12點了,您該吃藥了...