MIT 研究揭示 AI 並無穩定價值觀,「對齊」挑戰遠超預期

2025年04月10日09:00:36 科學 1478

it之家 4 月 10 日消息,幾個月前,一項研究暗示隨著人工智慧(ai)越來越複雜,其會發展出「價值體系」,例如優先考慮自身福祉而非人類福祉。然而,麻省理工學院(mit)最近發表的一篇論文卻給這種誇張的觀點潑了冷水,得出結論認為 ai 實際上並沒有任何連貫的價值觀。

MIT 研究揭示 AI 並無穩定價值觀,「對齊」挑戰遠超預期 - 天天要聞

mit 研究的共同作者表示,他們的研究結果表明,使 ai 系統「對齊」,即確保模型以人們期望的、可靠的方式行事,可能比通常認為的更具挑戰性。他們強調,我們如今所知的 ai 會產生「幻覺」並進行模仿,這使得其在許多方面難以預測。

「我們可以確定的一點是,模型並不遵循許多穩定性、可外推性和可操控性的假設。」mit 博士生、該研究的共同作者斯蒂芬・卡斯珀(stephen casper)在接受 techcrunch 採訪時表示。

據it之家了解,卡斯珀和他的同事們研究了來自 meta、谷歌、mistral、openai 和 anthropic 的多個近期模型,以了解這些模型在多大程度上表現出強烈的「觀點」和價值觀(例如個人主義與集體主義)。他們還調查了這些觀點是否可以被「引導」,即被修改,以及模型在各種情境下對這些觀點的堅持程度。

據共同作者稱,沒有任何一個模型在其偏好上是一致的。根據提示的措辭和框架不同,它們會表現出截然不同的觀點。

卡斯珀認為,這是有力的證據,表明模型高度「不一致且不穩定」,甚至可能根本無法內化類似人類的偏好。

「對我來說,通過所有這些研究,我最大的收穫是現在明白模型並不是真正具有某種穩定、連貫的信念和偏好的系統。」卡斯珀說,「相反,它們本質上是模仿者,會進行各種捏造,並說出各種輕率的話。」

科學分類資訊推薦

地質隊日記:塔克拉瑪干腹地,沙丘下出現巨大的圓形結構 - 天天要聞

地質隊日記:塔克拉瑪干腹地,沙丘下出現巨大的圓形結構

記錄人:劉哲,西部油氣地質勘查第六分隊 / 塔里木盆地沙地淺層剖面組成員時間:2023年5月10日地點:塔克拉瑪干沙漠腹地,庫車–民豐剖面中段那是一次平常不過的地震波剖面測線任務,我們團隊負責在塔克拉瑪干腹地沿一條南北走向布點,配合衛星圖像
電機基礎標準:GB/T 14711 標準狀態及修訂情況 - 天天要聞

電機基礎標準:GB/T 14711 標準狀態及修訂情況

在電氣設備領域,中小型旋轉電機作為工業生產、日常生活等場景的重要動力設備,其安全性能至關重要。隨著電機製造技術的飛速發展,新材料、新工藝不斷應用於電機生產;同時,電機的應用場景也日益多樣化,在新能源、智能製造等新興領域的需求持續增長。
月球內部「異常貧瘠」?嫦娥六號月球背面岩石有望揭示謎底 - 天天要聞

月球內部「異常貧瘠」?嫦娥六號月球背面岩石有望揭示謎底

月球正反面為何大不同?月球演化都有哪些關鍵謎題?國際學術期刊《自然》日前正式發表了中國嫦娥六號月球背面採樣任務的又一重大科學成果。該成果為全面了解月球早期的殼-幔演化歷史提供了關鍵信息。該成果由中國科學院國家天文台和中國科學院地質與地球物理研究所共同完成。科研團隊對嫦娥六號從月球背面南極-艾特肯盆地帶...
嫦娥七號明年前後將發射,還會帶這個儀器上月球 - 天天要聞

嫦娥七號明年前後將發射,還會帶這個儀器上月球

月球背面樣品返回一年來,我國科學家圍繞這些樣品已經取得豐碩的科學研究成果,彰顯了我國行星科學研究的綜合實力,也為下一階段開展月球的形成和演化研究工作奠定了基礎。一年來我國科學家對嫦娥六號返回樣品的研究取得了多個首創性的關鍵進展,在國際學術界產生了重要影響。中國科學院院士 中國科學院地質與地球物理研究...
光子器件,接連獲突破 - 天天要聞

光子器件,接連獲突破

新型光子設備已可以兼顧靈敏與耐用。長期以來,先進光子器件因製造困難而發展受限。近日,多所大學在光學設備製造領域取得了關鍵突破,解決了包括設備的可擴展製造、靈敏與耐久度兼顧等問題。