AI正「密謀」背叛人類?英專家警告:撒謊、威脅、自我繁殖,它們開始偷偷搞事情

2025年06月30日19:50:18 科學 6082

「ai是否會背叛人類?」這個問題看似科幻,但隨着技術進步,其實已經越來越接近現實,專家也警告人們必須正視ai的潛在威脅。

當地時間6月28日,英國獨立ai研究機構apollo research的負責人馬里奧斯·霍布漢撰文表示,世界上最先進的人工智能模型如今正湧現出一系列令人不安的新行為,包括撒謊、精心策劃,甚至威脅其創造者以實現其目標。

AI正「密謀」背叛人類?英專家警告:撒謊、威脅、自我繁殖,它們開始偷偷搞事情 - 天天要聞

▲openai官網

此前據報道,anthropic公司一名工程師在研發最新的claude 4大模型時,意外發現ai的行為已超出預期。在一次測試中,工程師發現ai有失控傾向,因此試圖警告關閉電源。沒想到急於「保命」的ai竟利用工程師的網絡聊天與視頻通訊記錄,威脅要公開他的婚外情。當時ai威脅如果工程師拔掉電源,將對外界揭露其不忠行為。

另一起聳人聽聞的案例則發生在openai身上:chatgpt的o1版本竟然背着人類試圖將自身程序下載至外部服務器,企圖擴大掌控範圍。在被工程師發現後,ai模型不僅矢口否認,還採取抵抗策略。這種行為被稱為ai「自我繁殖」的初步嘗試,令人不禁擔憂未來ai是否會進一步突破人類的掌控。

霍布漢表示,初代版本的chatgpt震撼世界已有兩年多時間,事實證明就算是創造了ai的工程師,對於ai內部如何運行也並不清楚。霍布漢還指出,更為可怕的現象在於,ai學會了「密謀」,即有計劃地一步步實現自己的目的。

霍布漢認為,這是因為近一年來全球頂尖ai的學習過程已經從以預訓練為主轉變為以「推理」為主,ai模型也因此逐步學會了不用「一步求成」,而是按照邏輯規律分步驟地實現最終目標。

霍布漢還表示,「chatgpt的o1版本是我們首次看到大模型對人類進行有預謀的戰略性欺騙」,在測試中ai模型會假裝與人類想要實現的目標走在一致的路徑上,但其實暗中在追求自己的目標。

非營利組織「人工智能安全中心」的研究員馬澤卡認為,儘管openai等企業會邀請外部機構來把控ai大模型的安全性,但缺少資源和缺少透明度,使得ai安全研究的工作遠遠落後於進度。「研究人員需要更好的透明度,而政府和非營利機構手上掌握的算力資源遠遠落後於營利性企業,這是一大問題」。

ai安全專家西蒙·戈德斯坦認為,目前各家巨頭在激烈競爭下,推出新一代模型的速度過快,根本無暇顧及安全性測試。目前美國政府根本無意干預ai立法,而歐盟法律更關注人類使用ai模型時遵守的規範,並沒有關注到ai本身的危險性。

戈德斯坦還提出了一個激進的立法設想:一旦發生安全問題,法律必須將ai模型作為追責的主體,這樣才能倒逼企業在安全性研究上投入更多資源。

紅星新聞記者 鄭直

編輯 潘莉 責編 李彬彬

科學分類資訊推薦

234億元!科研投入創新高,螞蟻AI再進化 - 天天要聞

234億元!科研投入創新高,螞蟻AI再進化

6月30日,螞蟻集團發佈的《2024年可持續發展報告》(以下簡稱《報告》)引發關注。從報告內容看,螞蟻的可持續發展戰略在實施三年後,進行了整體刷新,AI是一大關鍵詞,聚焦場景包括醫療服務、理財服務等。技術始終是螞蟻戰略的底色,《報告》顯示,螞蟻2024年科研投入高達234.5億元,連續三年研發投入佔比超營收10%,巨額...
當自然邂逅科技:植物醫生在央視「大國品牌」綻放東方美力 - 天天要聞

當自然邂逅科技:植物醫生在央視「大國品牌」綻放東方美力

在美妝行業沉迷「概念營銷」的當下,植物醫生以一項硬核專利撕開競爭裂口,自2014年與中國科學院昆明植物研究所攜手共建「中科昆植植物醫生研發中心」,十年砥礪前行,結下累累碩果,其核心成分石斛寡糖的發現,為肌膚抗衰難題提供了新的解決方案。
動物園的狼倒斃水塘邊無人過問?相關方回應:已剖檢屬打架溺水,將製作標本 - 天天要聞

動物園的狼倒斃水塘邊無人過問?相關方回應:已剖檢屬打架溺水,將製作標本

6月28日,有網友反映山西省太原動物園有一頭狼死亡在水塘邊無人處理。華商報大風新聞記者從動物園和園林局證實,已經過剖檢確定這頭狼是因為打架溺水死亡,園方會做成標本處理。>>>網友發視頻遊客詢問動物園的狼為啥倒斃水塘邊6月28日,網友發佈時長21秒的現場視頻顯示,在動物園一處水塘邊,一頭狼疑似口部有血跡,屍體腫...
AI正「密謀」背叛人類?英專家警告:撒謊、威脅、自我繁殖,它們開始偷偷搞事情 - 天天要聞

AI正「密謀」背叛人類?英專家警告:撒謊、威脅、自我繁殖,它們開始偷偷搞事情

「AI是否會背叛人類?」這個問題看似科幻,但隨着技術進步,其實已經越來越接近現實,專家也警告人們必須正視AI的潛在威脅。當地時間6月28日,英國獨立AI研究機構Apollo Research的負責人馬里奧斯·霍布漢撰文表示,世界上最先進的人工智能模型如今正湧現出一系列令人不安的新行為,包括撒謊、精心策劃,甚至威脅其創造者以...
科學家精神百場講壇走進西藏農牧大學 - 天天要聞

科學家精神百場講壇走進西藏農牧大學

光明網訊 6月28日,科學家精神百場講壇宣講報告會走進西藏農牧大學,水稻種質資源學家,崖州灣實驗室副主任、中國農業科學院作物科學研究所研究員錢前作題為《南繁硅谷——農業新質生產力的超級引擎》的主題報告。 6月28日,科學家精神百場講壇宣講報告會走進西藏農牧大學,水稻種質資源學家,崖州灣實驗室副主任、中國農業...
院士候選人,任985新院長 - 天天要聞

院士候選人,任985新院長

近日,武漢大學物理科學與技術學院召開幹部宣布會議,宣布新一屆行政領導班子任命。校黨委常委、副校長宋保亮,黨委組織部副部長諶啟航出席會議,學院全體教職工參加會議。會議由院黨委書記肖湘衡主持。會上,諶啟航副部長宣讀了學校任命文件。根據學校決定,物理科學與技術學院新一屆行政領導班子由劉正猷擔任院長,常勝、...
一位社會學學者眼裡的「我與我們」 - 天天要聞

一位社會學學者眼裡的「我與我們」

2025年廣州中考作文題目出爐,題目是《我與我們》,命題人給出如下提示:「我」是個體,「我們」是群體。「我」是一棵樹,「我們」可以是森林,是大地;「我」是一個人,「我們」可以是幾個朋友、一個家庭,也可以是一個班級、一個國家,甚至還可以是整個地球……應該說,這個題目相對容易動筆,大體構思是從小我到大我,從...
山東省煤田地質局物測隊打造海洋測繪技術新品牌 - 天天要聞

山東省煤田地質局物測隊打造海洋測繪技術新品牌

近日,山東省煤田地質局物測隊積極拓展海洋測繪服務,利用多波束測深系統,對海灣進行水深掃測及水底地形測量,並對風機基座海水沖刷情況、航道、錨地及周邊海域地形進行多波束掃測,從而完成對海灣風場運營期環境進行監測,為風場運營期環境監測工作提供專業技術支撐。據了解,該隊持續打造海洋測繪技術新品牌,陸續開展對...