MIT 研究揭示 AI 並無穩定價值觀,「對齊」挑戰遠超預期

2025年04月10日09:00:36 科學 1478

it之家 4 月 10 日消息,幾個月前,一項研究暗示隨著人工智慧(ai)越來越複雜,其會發展出「價值體系」,例如優先考慮自身福祉而非人類福祉。然而,麻省理工學院(mit)最近發表的一篇論文卻給這種誇張的觀點潑了冷水,得出結論認為 ai 實際上並沒有任何連貫的價值觀。

MIT 研究揭示 AI 並無穩定價值觀,「對齊」挑戰遠超預期 - 天天要聞

mit 研究的共同作者表示,他們的研究結果表明,使 ai 系統「對齊」,即確保模型以人們期望的、可靠的方式行事,可能比通常認為的更具挑戰性。他們強調,我們如今所知的 ai 會產生「幻覺」並進行模仿,這使得其在許多方面難以預測。

「我們可以確定的一點是,模型並不遵循許多穩定性、可外推性和可操控性的假設。」mit 博士生、該研究的共同作者斯蒂芬・卡斯珀(stephen casper)在接受 techcrunch 採訪時表示。

據it之家了解,卡斯珀和他的同事們研究了來自 meta、谷歌、mistral、openai 和 anthropic 的多個近期模型,以了解這些模型在多大程度上表現出強烈的「觀點」和價值觀(例如個人主義與集體主義)。他們還調查了這些觀點是否可以被「引導」,即被修改,以及模型在各種情境下對這些觀點的堅持程度。

據共同作者稱,沒有任何一個模型在其偏好上是一致的。根據提示的措辭和框架不同,它們會表現出截然不同的觀點。

卡斯珀認為,這是有力的證據,表明模型高度「不一致且不穩定」,甚至可能根本無法內化類似人類的偏好。

「對我來說,通過所有這些研究,我最大的收穫是現在明白模型並不是真正具有某種穩定、連貫的信念和偏好的系統。」卡斯珀說,「相反,它們本質上是模仿者,會進行各種捏造,並說出各種輕率的話。」

科學分類資訊推薦

宇宙6大未解之謎,可能人類永遠找不到答案(下) - 天天要聞

宇宙6大未解之謎,可能人類永遠找不到答案(下)

04時間真的在「流動」嗎?我們每天都在和「時間」打交道,但從科學角度看,時間可能是最容易被誤解的概念之一。我們覺得時間像一條線,從過去流向未來,我們站在中間的「現在」,隨著時間的流動不斷前進。
宇宙6大未解之謎,可能人類永遠找不到答案(上) - 天天要聞

宇宙6大未解之謎,可能人類永遠找不到答案(上)

在人類文明的發展史上,科學的力量一次次改寫了我們對世界的認知。從哥白尼提出「太陽不是宇宙中心」,到牛頓建立經典力學體系;從愛因斯坦彎曲了時空的結構,到薛定諤在貓的命運中揭示量子的不確定性——每一位偉大的科學家,都曾讓人類視野擴展了一大步。
5000多款產品亮相第九屆世界無人機大會 - 天天要聞

5000多款產品亮相第九屆世界無人機大會

以「步入低空經濟新時代」為主題的2025第九屆世界無人機大會23日在深圳開幕。同期舉行的國際低空經濟與無人系統博覽會及第十屆深圳國際無人機展覽會吸引了國內外825家企業,攜5000多款無人機系統裝備產品進行現場展示。5月23日,參會者了解一
國外空天公司開始銷售極光亞軌道太空梭 - 天天要聞

國外空天公司開始銷售極光亞軌道太空梭

5 月 22 日,國外航空航天公司宣布,它已開始接受可在亞軌道飛行中運載小型有效載荷的「極光」(Aurora)太空無人太空梭的訂單。 該飛機可攜帶6公斤有效載荷,飛行高度可達100公里。....
中國首個熱帶生物多樣性數字平台上線 - 天天要聞

中國首個熱帶生物多樣性數字平台上線

5月22日,由中國科學院西雙版納熱帶植物園打造的西雙版納生物多樣性平台正式上線,這是中國首個以熱帶生物多樣性為主題的數字平台,讓西雙版納超1.5萬種物種數據「有跡可循」。作者:孫敏、胡攀、張楠、楊林凱新華社音視頻部製作...