MIT 研究揭示 AI 並無穩定價值觀,「對齊」挑戰遠超預期

2025年04月10日09:00:36 科學 1478

it之家 4 月 10 日消息,幾個月前,一項研究暗示隨著人工智慧(ai)越來越複雜,其會發展出「價值體系」,例如優先考慮自身福祉而非人類福祉。然而,麻省理工學院(mit)最近發表的一篇論文卻給這種誇張的觀點潑了冷水,得出結論認為 ai 實際上並沒有任何連貫的價值觀。

MIT 研究揭示 AI 並無穩定價值觀,「對齊」挑戰遠超預期 - 天天要聞

mit 研究的共同作者表示,他們的研究結果表明,使 ai 系統「對齊」,即確保模型以人們期望的、可靠的方式行事,可能比通常認為的更具挑戰性。他們強調,我們如今所知的 ai 會產生「幻覺」並進行模仿,這使得其在許多方面難以預測。

「我們可以確定的一點是,模型並不遵循許多穩定性、可外推性和可操控性的假設。」mit 博士生、該研究的共同作者斯蒂芬・卡斯珀(stephen casper)在接受 techcrunch 採訪時表示。

據it之家了解,卡斯珀和他的同事們研究了來自 meta、谷歌、mistral、openai 和 anthropic 的多個近期模型,以了解這些模型在多大程度上表現出強烈的「觀點」和價值觀(例如個人主義與集體主義)。他們還調查了這些觀點是否可以被「引導」,即被修改,以及模型在各種情境下對這些觀點的堅持程度。

據共同作者稱,沒有任何一個模型在其偏好上是一致的。根據提示的措辭和框架不同,它們會表現出截然不同的觀點。

卡斯珀認為,這是有力的證據,表明模型高度「不一致且不穩定」,甚至可能根本無法內化類似人類的偏好。

「對我來說,通過所有這些研究,我最大的收穫是現在明白模型並不是真正具有某種穩定、連貫的信念和偏好的系統。」卡斯珀說,「相反,它們本質上是模仿者,會進行各種捏造,並說出各種輕率的話。」

科學分類資訊推薦

「軟黃金」冬蟲夏草,你真的了解嗎? - 天天要聞

「軟黃金」冬蟲夏草,你真的了解嗎?

冬蟲夏草千年傳承的滋補良藥採藥人的尋覓自公元780年起冬蟲夏草便以其獨特的藥用價值被載入史冊從《藏本草》到《中國藥典》均有記載李時珍更將其譽為「人身不老葯」贊其兼具蟲之陽剛與草之陰柔成為中藥中獨一無二的「陰陽同補」聖品享有「東方聖草」「葯中
【鏈博傳奇】中國中車:塑軌道之「鏈」,與世界同行 - 天天要聞

【鏈博傳奇】中國中車:塑軌道之「鏈」,與世界同行

中國中車集團有限公司(以下簡稱「中國中車」)是中國軌道交通裝備領域的「鏈」主企業,是全球規模領先、品種齊全、技術一流的高端裝備製造商和系統解決方案提供商,清潔能源裝備骨幹企業。當前,中國中車搭建了世界領先的軌道交通裝備產品技術研發平台,構建了完整的軌道交通裝備產業體系,開創了軌道交通裝備和清潔能源裝...
全國AI精英宜賓對決 長江首城創新大賽點燃人工智慧新引擎 - 天天要聞

全國AI精英宜賓對決 長江首城創新大賽點燃人工智慧新引擎

中新網四川新聞7月11日電(吳平華 楊錦 )智匯長江首城,共享成長價值,10日,由宜賓市科學技術局、宜賓市數據局、宜賓市高鐵南片區開發建設指揮部辦公室聯合主辦,北京中關村信息穀資產管理有限責任公司承辦的「長江首城宜創匯」協同創新大賽人工智慧
地質隊日記:塔克拉瑪干腹地,沙丘下出現巨大的圓形結構 - 天天要聞

地質隊日記:塔克拉瑪干腹地,沙丘下出現巨大的圓形結構

記錄人:劉哲,西部油氣地質勘查第六分隊 / 塔里木盆地沙地淺層剖面組成員時間:2023年5月10日地點:塔克拉瑪干沙漠腹地,庫車–民豐剖面中段那是一次平常不過的地震波剖面測線任務,我們團隊負責在塔克拉瑪干腹地沿一條南北走向布點,配合衛星圖像
電機基礎標準:GB/T 14711 標準狀態及修訂情況 - 天天要聞

電機基礎標準:GB/T 14711 標準狀態及修訂情況

在電氣設備領域,中小型旋轉電機作為工業生產、日常生活等場景的重要動力設備,其安全性能至關重要。隨著電機製造技術的飛速發展,新材料、新工藝不斷應用於電機生產;同時,電機的應用場景也日益多樣化,在新能源、智能製造等新興領域的需求持續增長。
月球內部「異常貧瘠」?嫦娥六號月球背面岩石有望揭示謎底 - 天天要聞

月球內部「異常貧瘠」?嫦娥六號月球背面岩石有望揭示謎底

月球正反面為何大不同?月球演化都有哪些關鍵謎題?國際學術期刊《自然》日前正式發表了中國嫦娥六號月球背面採樣任務的又一重大科學成果。該成果為全面了解月球早期的殼-幔演化歷史提供了關鍵信息。該成果由中國科學院國家天文台和中國科學院地質與地球物理研究所共同完成。科研團隊對嫦娥六號從月球背面南極-艾特肯盆地帶...