MIT 研究揭示 AI 並無穩定價值觀,「對齊」挑戰遠超預期

2025年04月10日09:00:36 科學 1478

it之家 4 月 10 日消息,幾個月前,一項研究暗示隨著人工智慧(ai)越來越複雜,其會發展出「價值體系」,例如優先考慮自身福祉而非人類福祉。然而,麻省理工學院(mit)最近發表的一篇論文卻給這種誇張的觀點潑了冷水,得出結論認為 ai 實際上並沒有任何連貫的價值觀。

MIT 研究揭示 AI 並無穩定價值觀,「對齊」挑戰遠超預期 - 天天要聞

mit 研究的共同作者表示,他們的研究結果表明,使 ai 系統「對齊」,即確保模型以人們期望的、可靠的方式行事,可能比通常認為的更具挑戰性。他們強調,我們如今所知的 ai 會產生「幻覺」並進行模仿,這使得其在許多方面難以預測。

「我們可以確定的一點是,模型並不遵循許多穩定性、可外推性和可操控性的假設。」mit 博士生、該研究的共同作者斯蒂芬・卡斯珀(stephen casper)在接受 techcrunch 採訪時表示。

據it之家了解,卡斯珀和他的同事們研究了來自 meta、谷歌、mistral、openai 和 anthropic 的多個近期模型,以了解這些模型在多大程度上表現出強烈的「觀點」和價值觀(例如個人主義與集體主義)。他們還調查了這些觀點是否可以被「引導」,即被修改,以及模型在各種情境下對這些觀點的堅持程度。

據共同作者稱,沒有任何一個模型在其偏好上是一致的。根據提示的措辭和框架不同,它們會表現出截然不同的觀點。

卡斯珀認為,這是有力的證據,表明模型高度「不一致且不穩定」,甚至可能根本無法內化類似人類的偏好。

「對我來說,通過所有這些研究,我最大的收穫是現在明白模型並不是真正具有某種穩定、連貫的信念和偏好的系統。」卡斯珀說,「相反,它們本質上是模仿者,會進行各種捏造,並說出各種輕率的話。」

科學分類資訊推薦

標本「飛天」報告提速!深圳龍崗無人機醫療運輸網月底全覆蓋 - 天天要聞

標本「飛天」報告提速!深圳龍崗無人機醫療運輸網月底全覆蓋

5月8日,寶龍灣區未來科技園正式開園,標誌著深圳在高新技術產業發展領域又邁出了堅實一步。由龍崗中心醫院與亞輝龍攜手打造的 「低空物流 + 集團檢驗中心」 創新成果在開園儀式上驚艷亮相,成為全場焦點。據悉,5月下旬,「無人機運輸社康標本」項目還將陸續開通7條航線,完成龍崗中心醫院下屬29個社康全覆蓋。今年 3 月,...
李 庚|忽如一夜春風至 中國硬核創奇蹟 - 天天要聞

李 庚|忽如一夜春風至 中國硬核創奇蹟

忽如一夜春風至中國硬核創奇蹟作者 李 庚當人形機器人與馬拉松運動員並肩奔跑在北京亦庄的賽道上,當2025年央視春晚舞台上機器人整齊劃一地扭起大秧歌,這些曾經只存在於科幻電影中的場景,正以令人驚嘆的速度走進現實。
共啟產業高質量發展行動 第五屆中國·壽仙谷靈芝文化節在杭啟幕 - 天天要聞

共啟產業高質量發展行動 第五屆中國·壽仙谷靈芝文化節在杭啟幕

4月30日,第五屆中國·壽仙谷靈芝文化節在杭州南宋德壽宮啟幕。本屆靈芝文化節以文化市集、啟幕盛典、宋韻雅宴三大篇章展開,來自中醫藥、科研、體育、電商等各界嘉賓齊聚一堂,展現了靈芝產業「承古法、立新章」的蓬勃氣象。圖為第五屆中國·壽仙谷靈芝文化節啟幕現場(受訪單位供圖)本屆壽仙谷靈芝文化節巧妙融合了傳統...
海邊遇到水母別碰有毒!醫生:被蜇傷要用海水沖洗 - 天天要聞

海邊遇到水母別碰有毒!醫生:被蜇傷要用海水沖洗

隨著夏季來臨,水上活動增多。近期,有遊客在廣東珠海橫石基沙灘、木頭沖沙灘等地發現了一些像塑料袋一樣的物體,很多人還會用手觸摸。其實這些「不速之客」是水母。醫生也提醒:水母有毒,千萬別碰!據統計,我國沿海有30多種水母會蜇人。這些水母的觸鬚上
貴州大學助力中國真菌研究在「一帶一路」上開花結果 - 天天要聞

貴州大學助力中國真菌研究在「一帶一路」上開花結果

走進貴州大學農學院實驗室,空氣中瀰漫著新鮮菌菇特有的泥土芬芳。來自印度、泰國和巴基斯坦的留學生們端坐於操作台前,在無菌氣流環境下小心翼翼地分離純化菌種,為後續研究做準備。 地處中國西南的貴州省氣候濕熱、雨量充沛,為菌類生長提供了得天獨厚的自然條件。當地「靠山吃山」的飲食傳統中蘊藏著豐富的野生菌資源,...