MIT 研究揭示 AI 並無穩定價值觀,“對齊”挑戰遠超預期

2025年04月10日09:00:36 科學 1478

it之家 4 月 10 日消息,幾個月前,一項研究暗示隨着人工智能(ai)越來越複雜,其會發展出“價值體系”,例如優先考慮自身福祉而非人類福祉。然而,麻省理工學院(mit)最近發表的一篇論文卻給這種誇張的觀點潑了冷水,得出結論認為 ai 實際上並沒有任何連貫的價值觀。

MIT 研究揭示 AI 並無穩定價值觀,“對齊”挑戰遠超預期 - 天天要聞

mit 研究的共同作者表示,他們的研究結果表明,使 ai 系統“對齊”,即確保模型以人們期望的、可靠的方式行事,可能比通常認為的更具挑戰性。他們強調,我們如今所知的 ai 會產生“幻覺”並進行模仿,這使得其在許多方面難以預測。

“我們可以確定的一點是,模型並不遵循許多穩定性、可外推性和可操控性的假設。”mit 博士生、該研究的共同作者斯蒂芬・卡斯珀(stephen casper)在接受 techcrunch 採訪時表示。

據it之家了解,卡斯珀和他的同事們研究了來自 meta、谷歌、mistral、openai 和 anthropic 的多個近期模型,以了解這些模型在多大程度上表現出強烈的“觀點”和價值觀(例如個人主義與集體主義)。他們還調查了這些觀點是否可以被“引導”,即被修改,以及模型在各種情境下對這些觀點的堅持程度。

據共同作者稱,沒有任何一個模型在其偏好上是一致的。根據提示的措辭和框架不同,它們會表現出截然不同的觀點。

卡斯珀認為,這是有力的證據,表明模型高度“不一致且不穩定”,甚至可能根本無法內化類似人類的偏好。

“對我來說,通過所有這些研究,我最大的收穫是現在明白模型並不是真正具有某種穩定、連貫的信念和偏好的系統。”卡斯珀說,“相反,它們本質上是模仿者,會進行各種捏造,並說出各種輕率的話。”

科學分類資訊推薦

中國攻克光刻機光源,技術有別於阿斯麥 - 天天要聞

中國攻克光刻機光源,技術有別於阿斯麥

“中國突破了自主生產先進芯片的障礙!”,最近,《南華早報》發布的一篇報道,公布了一個振奮人心的消息,中國在西方拚命“卡脖子”的光刻機領域,取得了一項重要的研究成果。 據悉,中國科學院上海光....
走在開放前沿,它們靠什麼成為全球資源“強磁場”? - 天天要聞

走在開放前沿,它們靠什麼成為全球資源“強磁場”?

每經編輯:楊歡圖片來源:成都東部新區供圖從地面到天空,一座座拔地而起的機場正悄然改寫城市命運。全球化加速推進,越來越多城市加碼入局樞紐機場競爭,期待在加速聯通世界中重塑經濟地理與城市競爭力。一個普遍共識是,更高效便利的航空運輸會成為帶動貿易發展、人才流動、資源共享的全新動力源,進而創造面向未來發展的...
聯想“稀土外殼”爭議:美國能否靠回收提煉打破中國稀土封鎖? - 天天要聞

聯想“稀土外殼”爭議:美國能否靠回收提煉打破中國稀土封鎖?

背景:稀土出口管制下的“變相出口”疑雲近期,聯想推出的“稀土鎂合金”筆記本電腦外殼引發輿論爭議。據網友爆料,其外殼中使用的釔元素屬於中國嚴格管控的7類中重稀土之一。儘管中國已對稀土出口實施限制,但聯想通過將稀土加工成合金材料並嵌入筆記本電腦
歐盟砸5億歐元“搶人”,馬克龍:歐洲要做科學家的避風港 - 天天要聞

歐盟砸5億歐元“搶人”,馬克龍:歐洲要做科學家的避風港

當地時間5月5日,一場名為“為了科學 選擇歐洲”的大會在法國巴黎召開。法國與歐盟委員會在會上宣布,在美國特朗普政府減少對科研領域的資助之際,歐盟將設立一項總值5億歐元的科研激勵計劃,吸引外國的科研人員,特別是來自美國的科研人員前來工作。
木星發現巨型熔岩湖?朱諾號探測器傳回最新發現 - 天天要聞

木星發現巨型熔岩湖?朱諾號探測器傳回最新發現

木星北極的氣旋群像一群詭異的舞者,以超過160公里的時速相互碰撞;木衛一的熔岩湖在冰冷外殼下暗流涌動,熾熱岩漿隨時可能噴薄而出——這些堪比科幻大片的場景,正是NASA朱諾號探測器最新傳回的太陽系真相。
哈爾濱市第44屆“愛鳥周”活動啟幕 - 天天要聞

哈爾濱市第44屆“愛鳥周”活動啟幕

來源:【冰城+】5月5日,以“清除鳥網 密織法網 讓鳥兒自由飛翔”為主題的哈爾濱市第44屆“愛鳥周”活動啟動儀式在北方森林動物園百鳥廣場舉行。本次活動由市林業和草原局、公安局食葯環偵支隊、北方森林動物園等單位聯合舉辦。
比不讀書更糟!日本一教授10年的研究結果顯示,玩手機恐致發育停滯 - 天天要聞

比不讀書更糟!日本一教授10年的研究結果顯示,玩手機恐致發育停滯

近日,日本東北大學加齡醫學研究所教授川島隆太的一項研究顯示,過度使用手機與學生學業成績下滑、腦部發育停滯有顯著關聯。(日本一教授10年的研究結果顯示,玩手機恐致發育停滯。)川島從2010年開始,對日本宮城縣仙台市約7萬名中小學生進行長達10年的追蹤調查。他指出,每天使用屏幕(包括電視、手機)的時間超過一個小...
中國醫學科學院魯帥堯/王佑春/孫強明研究設計CHIKV mRNA疫苗 - 天天要聞

中國醫學科學院魯帥堯/王佑春/孫強明研究設計CHIKV mRNA疫苗

點擊上方“Vaccine前研”,關注最新疫苗動態iNature隨着基孔肯雅病毒(CHIKV)的廣泛傳播,對更有效、保護性更強的疫苗的需求越來越大。2025年3月28日,中國醫學科學院魯帥堯、王佑春、孫強明共同通訊在Signal Transduction and Tatgeted Therapy上在線發表題為“CHIKV mRNA vaccines encod