MIT 研究揭示 AI 並無穩定價值觀，「對齊」挑戰遠超預期

2025年04月10日09:00:36 科學 1478

it之家 4 月 10 日消息，幾個月前，一項研究暗示隨著人工智慧（ai）越來越複雜，其會發展出「價值體系」，例如優先考慮自身福祉而非人類福祉。然而，麻省理工學院（mit）最近發表的一篇論文卻給這種誇張的觀點潑了冷水，得出結論認為 ai 實際上並沒有任何連貫的價值觀。

mit 研究的共同作者表示，他們的研究結果表明，使 ai 系統「對齊」，即確保模型以人們期望的、可靠的方式行事，可能比通常認為的更具挑戰性。他們強調，我們如今所知的 ai 會產生「幻覺」並進行模仿，這使得其在許多方面難以預測。

「我們可以確定的一點是，模型並不遵循許多穩定性、可外推性和可操控性的假設。」mit 博士生、該研究的共同作者斯蒂芬・卡斯珀（stephen casper）在接受 techcrunch 採訪時表示。

據it之家了解，卡斯珀和他的同事們研究了來自 meta、谷歌、mistral、openai 和 anthropic 的多個近期模型，以了解這些模型在多大程度上表現出強烈的「觀點」和價值觀（例如個人主義與集體主義）。他們還調查了這些觀點是否可以被「引導」，即被修改，以及模型在各種情境下對這些觀點的堅持程度。

據共同作者稱，沒有任何一個模型在其偏好上是一致的。根據提示的措辭和框架不同，它們會表現出截然不同的觀點。

卡斯珀認為，這是有力的證據，表明模型高度「不一致且不穩定」，甚至可能根本無法內化類似人類的偏好。

「對我來說，通過所有這些研究，我最大的收穫是現在明白模型並不是真正具有某種穩定、連貫的信念和偏好的系統。」卡斯珀說，「相反，它們本質上是模仿者，會進行各種捏造，並說出各種輕率的話。」

科學

造謠傳播「院士預測廣東將發生8級以上大地震」，4人被罰！ - 天天要聞

造謠傳播「院士預測廣東將發生8級以上大地震」，4人被罰！

近日，一張「院士預測廣東將發生8級以上大地震」的截圖在網路上傳播，引發大量網民關注討論。

07月11日 1255

地質隊日記：塔克拉瑪干腹地，沙丘下出現巨大的圓形結構 - 天天要聞

地質隊日記：塔克拉瑪干腹地，沙丘下出現巨大的圓形結構

記錄人：劉哲，西部油氣地質勘查第六分隊 / 塔里木盆地沙地淺層剖面組成員時間：2023年5月10日地點：塔克拉瑪干沙漠腹地，庫車–民豐剖面中段那是一次平常不過的地震波剖面測線任務，我們團隊負責在塔克拉瑪干腹地沿一條南北走向布點，配合衛星圖像

07月11日 1680

科學家破解神秘星際天體飛掠太陽系，時速24萬公里，12月逼近地球 - 天天要聞

科學家破解神秘星際天體飛掠太陽系，時速24萬公里，12月逼近地球

哈佛大學物理學家阿維·勒布與學生研究員肖赫魯茲·卡哈羅夫追蹤了星際天體3I/ATLAS的路徑，揭開其神秘面紗，發現其來自銀河系較厚區域，棲居著更古老的恆星。這顆寬約19公里的天體以每小時....

07月11日 9641

電機基礎標準：GB/T 14711 標準狀態及修訂情況 - 天天要聞

電機基礎標準：GB/T 14711 標準狀態及修訂情況

在電氣設備領域，中小型旋轉電機作為工業生產、日常生活等場景的重要動力設備，其安全性能至關重要。隨著電機製造技術的飛速發展，新材料、新工藝不斷應用於電機生產；同時，電機的應用場景也日益多樣化，在新能源、智能製造等新興領域的需求持續增長。

07月11日 1032

HIV疫苗研發：老人要加量、小孩愛鼻噴，每個群體都有專屬方案！ - 天天要聞

HIV疫苗研發：老人要加量、小孩愛鼻噴，每個群體都有專屬方案！

您知道嗎？HIV疫苗研發藏著不少巧思——為啥老人要加劑量？小孩偏愛鼻噴式？不同群體都有專屬方案。研究者咋做到的？靠科學適配和貼心設計。——歡迎您閱讀、關注、點贊、收藏、諮詢與理性討論！ ▶️一、引言你可能沒留意，同樣是HIV風險人群，日子過

07月11日 1520

月球內部「異常貧瘠」？嫦娥六號月球背面岩石有望揭示謎底 - 天天要聞

月球內部「異常貧瘠」？嫦娥六號月球背面岩石有望揭示謎底

月球正反面為何大不同？月球演化都有哪些關鍵謎題？國際學術期刊《自然》日前正式發表了中國嫦娥六號月球背面採樣任務的又一重大科學成果。該成果為全面了解月球早期的殼-幔演化歷史提供了關鍵信息。該成果由中國科學院國家天文台和中國科學院地質與地球物理研究所共同完成。科研團隊對嫦娥六號從月球背面南極-艾特肯盆地帶...

07月10日 6891

KBBF晶體：中國原創技術，領先美國15年。能做DUV光源！ - 天天要聞

KBBF晶體：中國原創技術，領先美國15年。能做DUV光源！

Nature雜誌曾發了一篇文章——《China's crystal cache》。中文媒體對這個標題的翻譯，一般是《中國藏起了這種晶體》。主要內容是吐槽，中國禁運KBBF晶體，對美國相關領域產生了影響。最後在2016年，美國先進光學晶體公司

07月10日 1886

俗語「入伏逢單熱死牛，入伏逢雙涼嗖嗖」，啥意思，有科學道理？ - 天天要聞

俗語「入伏逢單熱死牛，入伏逢雙涼嗖嗖」，啥意思，有科學道理？

「入伏逢單熱死牛，入伏逢雙涼嗖嗖」是一句流傳於中國民間的氣象俗語，意指入伏日期的單雙數與夏季炎熱程度的關係。具體來說，如果入伏當天是農曆的單數日（如初一、初三等），則預示著接下來的三伏天會異常炎熱，甚至「熱死牛」；反之，若入伏當天是雙數日（

07月10日 1481

嫦娥七號明年前後將發射，還會帶這個儀器上月球 - 天天要聞

嫦娥七號明年前後將發射，還會帶這個儀器上月球

月球背面樣品返回一年來，我國科學家圍繞這些樣品已經取得豐碩的科學研究成果，彰顯了我國行星科學研究的綜合實力，也為下一階段開展月球的形成和演化研究工作奠定了基礎。一年來我國科學家對嫦娥六號返回樣品的研究取得了多個首創性的關鍵進展，在國際學術界產生了重要影響。中國科學院院士中國科學院地質與地球物理研究...

07月10日 9303

光子器件，接連獲突破 - 天天要聞

光子器件，接連獲突破

新型光子設備已可以兼顧靈敏與耐用。長期以來，先進光子器件因製造困難而發展受限。近日，多所大學在光學設備製造領域取得了關鍵突破，解決了包括設備的可擴展製造、靈敏與耐久度兼顧等問題。

07月10日 1672