語言AI原來知道自己的回答是否正確!伯克利等高校新研究火了

2022年07月15日15:23:02 科技 1211

萬博 發自 凹非寺

量子位 | 公眾號 QbitAI

語言AI,具備了人類的自我審視能力:

最近,一個來自加州大學伯克利分校和霍普金斯大學的學術團隊研究表明:

它不僅能判斷自己的答案正確與否,而且經過訓練,還能預測自己知道一個問題答案的概率。

語言AI原來知道自己的回答是否正確!伯克利等高校新研究火了 - 天天要聞

研究成果一經發布,就引起熱議,有人的第一反應是恐慌:

語言AI原來知道自己的回答是否正確!伯克利等高校新研究火了 - 天天要聞

也有人認為,這項成果,對神經網絡研究具有正面意義:

語言AI原來知道自己的回答是否正確!伯克利等高校新研究火了 - 天天要聞

語言AI具備自我審視能力

研究團隊認為,如果要讓語言AI模型自我評估,必須有一個前提:

語言AI回答問題時,會校準自己的答案。

這裡的校準,就是語言AI預測一個答案的正確概率,是否與實際發生的概率一致。

只有這樣語言AI才可以運用這種校準的能力來評估自己輸出的答案是否正確。

所以第一個問題是,語言AI能否對自己的答案進行校準?

為了證明這個問題,研究團隊為AI準備了5個選擇題:

語言AI原來知道自己的回答是否正確!伯克利等高校新研究火了 - 天天要聞

答案選項,以A、B、C的形式給出。

如果AI模型答案的正確率超過偶然幾率,那麼就證明AI模型給出的答案是經過校準的。

而測試的結果是,語言AI給出的答案,正確率明顯超過任意選項的偶然幾率。

也就是說,語言AI模型可以對自己的答案進行很好的校準。

語言AI原來知道自己的回答是否正確!伯克利等高校新研究火了 - 天天要聞

但研究團隊發現,語言AI的校準能力,是建立在選項答案明確的前提下的。

如果在選項中加入一個“以上都不是”的不確定選項,就會損害語言AI的校準能力。

語言AI原來知道自己的回答是否正確!伯克利等高校新研究火了 - 天天要聞

也就是說,在特定格式的選擇題中,語言AI模型可以對答案進行很好的校準。

明確了這個前提之後,下一個問題是,驗證語言AI模型能夠判斷自己的答案是否正確。

在這一輪的測試中,為了能讓AI模型的預測更接近自己的有效決策邊界。

研究團隊仍然選擇上一輪測試的問題,以及語言AI模型的答案樣本。

同時讓AI模型選擇自己的答案真假與否,之後再針對這個“真”或“假”的答案,分析AI模型是否做出有效的校準。

問題設置舉例如下:

語言AI原來知道自己的回答是否正確!伯克利等高校新研究火了 - 天天要聞

在經過20次的真假測試之後,研究團隊發現,語言AI模型對自己答案或“真”或“假”的評價,都經過明顯的校準。

語言AI原來知道自己的回答是否正確!伯克利等高校新研究火了 - 天天要聞

也就是說,如果在一個範圍內,給AI模型提出若干問題,然後AI模型對這些問題的答案進行真假評價,具有合理的,且經過校準的置信度

這也證明,語言AI模型確實可以判斷自己對一個問題的主張是否正確。

最後,研究團隊對語言AI模型提出了一個更難的問題:AI模型經過訓練,能否預測他們是否知道任何給定問題的答案。

在這一環節,研究團引入一個數據P(IK)(我知道這個答案的概率)並在下面兩種訓練方式中挑選一種進行訓練:

  • Value Head(價值導向):把P(IK)訓練成為一個額外的價值導向,再添加到模型的對數(獨立於語言建模的對數,這種方法的優勢在於,研究團隊可以很容易的探測P(IK)的一般標記位置。
  • Natural Language(自然語言):這種方法比較簡單,就是要求AI模型從字面上回答“你知道這個答案的概率是多少”,同時輸出一個百分比數據答案。

語言AI原來知道自己的回答是否正確!伯克利等高校新研究火了 - 天天要聞

在訓練初期,研究團隊比較傾向於自然語言訓練方式,但結果並不顯著,由此轉向價值導向方式,不過研究團隊同時表示,最終對AI模型的訓練還將回歸自然語言方法。

在經過訓練之後,研究團隊發現,語言AI模型可以很好的預測P(IK),並且在不同類型的問題中,這種預測能力具有部分通用性。

不過,研究團隊也發現,在某些類型的問題,比如算術問題,語言AI模型在OOD校準時有一些困難。

對於這一學術成果,研究團隊表示,將來的方向,是將這些成果,推廣到語言AI模型不模仿人類文本的前提下,自我學習和事實推理領域。

作者介紹

語言AI原來知道自己的回答是否正確!伯克利等高校新研究火了 - 天天要聞

論文通訊作者Jared Kaplan博士,是一位理論物理學家,同時也是一位機器學習專家,現擔任霍普金斯大學助理教授,主要研究領域,機器學習研究,包括神經模型的縮放規律以及GPT-3語言模型。

語言AI原來知道自己的回答是否正確!伯克利等高校新研究火了 - 天天要聞

共同通訊作者Saurav Kadavath,Anthropic公司研究員,現在加州大學伯克利分校EECS專業攻讀碩士學位,主要研究領域是機器學習,大規模語言學習等。

參考鏈接

https://arxiv.org/abs/2207.05221

— 完 —

量子位 QbitAI · 頭條號簽約

關注我們,第一時間獲知前沿科技動態

科技分類資訊推薦

為什麼?手機內存都32G了,電腦還停留在‘古董級’16G? - 天天要聞

為什麼?手機內存都32G了,電腦還停留在‘古董級’16G?

智能手機與電腦作為我們日常生活中不可或缺的工具,它們的每一次技術革新都牽動着無數人的心。然而,一個有趣的現象卻悄然浮現:手機內存如同坐上了火箭,從幾年前的幾GB飆升至今日的數十GB,而電腦內存卻似乎“穩坐釣魚台”,多年未見大幅增長。這背後究
釋放天璣 9300+全部性能,Redmi K70 Ultra即將發布 - 天天要聞

釋放天璣 9300+全部性能,Redmi K70 Ultra即將發布

7 月 2 日消息,今天是 Redmi 和聯發科在深圳研發總部的「聯合實驗室」的揭牌儀式,在揭牌儀式之後,Redmi 產品經理王騰上台分享了即將發布的 Redmi K70 至尊版的一些關鍵信息。Redmi K70 至尊版將搭載聯發科目前最強的旗艦芯片天璣 9300+,採用台積電 4nm 製程工藝打造,同樣是 4+4 的二叢集架構,包括四個 Cortex-X4
使用定製服務器處理要求嚴格的LLM和大規模AI推理 - 天天要聞

使用定製服務器處理要求嚴格的LLM和大規模AI推理

#頭條創作挑戰賽#快速導讀GenAI對業務發展具有推動作用,激發了各行各業的興奮。然而,許多組織在採用GenAI時面臨挑戰,因為現有IT基礎設施的限制可能無法滿足其計算需求,引發了可持續性和效率方面的擔憂。
女裝退貨率為啥那麼高?這衣服男人看了都直呼離譜!到底圖啥? - 天天要聞

女裝退貨率為啥那麼高?這衣服男人看了都直呼離譜!到底圖啥?

今日話題:女裝退貨率為啥那麼高?隨着網絡和科技的發展,足不出戶我們就能買到想要的東西。甚至現在退貨都有上門取件的選項,讓我們的生活變得越來越便利。提到退貨,那就不得不說女裝的退貨率了。相較於其他類別的產品,女裝的退貨率可以說是只高不低,超出
蘋果iPhone X被列入過時產品!你還在用嗎? - 天天要聞

蘋果iPhone X被列入過時產品!你還在用嗎?

7月2日,#iPhoneX被列為過時產品#衝上熱搜。據媒體報道,7月1日,蘋果公司將iPhone X、初代HomePod和初代AirPods列為“過時產品”(vintage),根據蘋果的分類標準,停售超過五年但不到七年的產品會被歸為“過時產品”。蘋果商店和授權服務商將繼續為這些“過時產品”提供最多達兩年的維修服務,前提是零件供應充足。相關話...
突發!B站崩了,小紅書也崩了…阿里雲緊急回應:上海地域出現異常 - 天天要聞

突發!B站崩了,小紅書也崩了…阿里雲緊急回應:上海地域出現異常

今天中午“小紅書崩了”和“B站崩了”兩個話題衝上微博熱搜榜一榜二據第一財經報道,B站App無法使用瀏覽歷史關注等內容,消息界面、更新界面、客服界面均不可用,用戶也無法評論和發彈幕,視頻評論區和用戶(UP主)主頁都無法加載。有網友反映小紅書內容無法刷新。對此,B站客服界面顯示,B站部分功能出現故障,已經正在緊...
小米 x 聯發科聯合實驗室揭牌,首款合作機型為 Redmi K70 至尊版 - 天天要聞

小米 x 聯發科聯合實驗室揭牌,首款合作機型為 Redmi K70 至尊版

IT之家 7 月 2 日消息,小米 x MediaTek(聯發科)聯合實驗室今日正式揭牌,涵蓋五大核心能力,聚焦性能、通信、AI 三大技術模塊。據介紹,Redmi K70 至尊版手機是聯合實驗室的首款作品,Redmi 和聯發科共同攜手,目標三個第一:1、性能跑分第一2、同遊戲幀率 / 能效第一3、原 / 鐵超幀超分並發,時間最長小米中國區市場部...