語言AI原來知道自己的回答是否正確!伯克利等高校新研究火了

2022年07月15日15:23:02 科技 1211

萬博 發自 凹非寺

量子位 | 公眾號 QbitAI

語言AI,具備了人類的自我審視能力:

最近,一個來自加州大學伯克利分校和霍普金斯大學的學術團隊研究表明:

它不僅能判斷自己的答案正確與否,而且經過訓練,還能預測自己知道一個問題答案的概率。

語言AI原來知道自己的回答是否正確!伯克利等高校新研究火了 - 天天要聞

研究成果一經發布,就引起熱議,有人的第一反應是恐慌:

語言AI原來知道自己的回答是否正確!伯克利等高校新研究火了 - 天天要聞

也有人認為,這項成果,對神經網路研究具有正面意義:

語言AI原來知道自己的回答是否正確!伯克利等高校新研究火了 - 天天要聞

語言AI具備自我審視能力

研究團隊認為,如果要讓語言AI模型自我評估,必須有一個前提:

語言AI回答問題時,會校準自己的答案。

這裡的校準,就是語言AI預測一個答案的正確概率,是否與實際發生的概率一致。

只有這樣語言AI才可以運用這種校準的能力來評估自己輸出的答案是否正確。

所以第一個問題是,語言AI能否對自己的答案進行校準?

為了證明這個問題,研究團隊為AI準備了5個選擇題:

語言AI原來知道自己的回答是否正確!伯克利等高校新研究火了 - 天天要聞

答案選項,以A、B、C的形式給出。

如果AI模型答案的正確率超過偶然幾率,那麼就證明AI模型給出的答案是經過校準的。

而測試的結果是,語言AI給出的答案,正確率明顯超過任意選項的偶然幾率。

也就是說,語言AI模型可以對自己的答案進行很好的校準。

語言AI原來知道自己的回答是否正確!伯克利等高校新研究火了 - 天天要聞

但研究團隊發現,語言AI的校準能力,是建立在選項答案明確的前提下的。

如果在選項中加入一個「以上都不是」的不確定選項,就會損害語言AI的校準能力。

語言AI原來知道自己的回答是否正確!伯克利等高校新研究火了 - 天天要聞

也就是說,在特定格式的選擇題中,語言AI模型可以對答案進行很好的校準。

明確了這個前提之後,下一個問題是,驗證語言AI模型能夠判斷自己的答案是否正確。

在這一輪的測試中,為了能讓AI模型的預測更接近自己的有效決策邊界。

研究團隊仍然選擇上一輪測試的問題,以及語言AI模型的答案樣本。

同時讓AI模型選擇自己的答案真假與否,之後再針對這個「真」或「假」的答案,分析AI模型是否做出有效的校準。

問題設置舉例如下:

語言AI原來知道自己的回答是否正確!伯克利等高校新研究火了 - 天天要聞

在經過20次的真假測試之後,研究團隊發現,語言AI模型對自己答案或「真」或「假」的評價,都經過明顯的校準。

語言AI原來知道自己的回答是否正確!伯克利等高校新研究火了 - 天天要聞

也就是說,如果在一個範圍內,給AI模型提出若干問題,然後AI模型對這些問題的答案進行真假評價,具有合理的,且經過校準的置信度

這也證明,語言AI模型確實可以判斷自己對一個問題的主張是否正確。

最後,研究團隊對語言AI模型提出了一個更難的問題:AI模型經過訓練,能否預測他們是否知道任何給定問題的答案。

在這一環節,研究團引入一個數據P(IK)(我知道這個答案的概率)並在下面兩種訓練方式中挑選一種進行訓練:

  • Value Head(價值導向):把P(IK)訓練成為一個額外的價值導向,再添加到模型的對數(獨立於語言建模的對數,這種方法的優勢在於,研究團隊可以很容易的探測P(IK)的一般標記位置。
  • Natural Language(自然語言):這種方法比較簡單,就是要求AI模型從字面上回答「你知道這個答案的概率是多少」,同時輸出一個百分比數據答案。

語言AI原來知道自己的回答是否正確!伯克利等高校新研究火了 - 天天要聞

在訓練初期,研究團隊比較傾向於自然語言訓練方式,但結果並不顯著,由此轉向價值導向方式,不過研究團隊同時表示,最終對AI模型的訓練還將回歸自然語言方法。

在經過訓練之後,研究團隊發現,語言AI模型可以很好的預測P(IK),並且在不同類型的問題中,這種預測能力具有部分通用性。

不過,研究團隊也發現,在某些類型的問題,比如算術問題,語言AI模型在OOD校準時有一些困難。

對於這一學術成果,研究團隊表示,將來的方向,是將這些成果,推廣到語言AI模型不模仿人類文本的前提下,自我學習和事實推理領域。

作者介紹

語言AI原來知道自己的回答是否正確!伯克利等高校新研究火了 - 天天要聞

論文通訊作者Jared Kaplan博士,是一位理論物理學家,同時也是一位機器學習專家,現擔任霍普金斯大學助理教授,主要研究領域,機器學習研究,包括神經模型的縮放規律以及GPT-3語言模型。

語言AI原來知道自己的回答是否正確!伯克利等高校新研究火了 - 天天要聞

共同通訊作者Saurav Kadavath,Anthropic公司研究員,現在加州大學伯克利分校EECS專業攻讀碩士學位,主要研究領域是機器學習,大規模語言學習等。

參考鏈接

https://arxiv.org/abs/2207.05221

— 完 —

量子位 QbitAI · 頭條號簽約

關注我們,第一時間獲知前沿科技動態

科技分類資訊推薦

「謝謝」美國幫了3個大忙!中國AI突飛猛進,俄羅斯多賺5萬億 - 天天要聞

「謝謝」美國幫了3個大忙!中國AI突飛猛進,俄羅斯多賺5萬億

開始閱讀前,點下「關注」,咱們保持聯繫,後續精彩不錯過。感謝你的加入!美國,這位曾經的科技霸主,揮舞著制裁的大棒,試圖讓中國和俄羅斯屈服。令人意想不到的是,這一系列制裁行動,卻意外地成為了兩國科技飛躍的催化劑。當一個國家被逼到牆角,它所爆發
真我13 Pro+入網:外觀和配置徹底曝光,優缺點都很明顯 - 天天要聞

真我13 Pro+入網:外觀和配置徹底曝光,優缺點都很明顯

7月4日消息,型號為RMX3920的真我新機入網工信部,它就是此前曝光的真我13 Pro+。和真我12 Pro+相比,這款新機的續航和快充升級,並且機身更加輕薄,還有全新的5000萬潛望式長焦鏡頭。遺憾的是缺點也同樣明顯,比如相同的性能配置
真我GT6真機曝光,相機模組有驚喜 - 天天要聞

真我GT6真機曝光,相機模組有驚喜

7月4日,真我GT6入網工信部,硬體參數和外觀設計被徹底曝光,最讓人驚喜的是後置相機模組。該機的配置和爆料基本吻合,核心優勢是5800毫安時電池和6.78英寸OLED無雙直屏,還有目前最強大的驍龍8Gen3處理器。
2024世界人工智慧大會|AI如何賦能智慧出行?T3出行崔大勇透露這些信息 - 天天要聞

2024世界人工智慧大會|AI如何賦能智慧出行?T3出行崔大勇透露這些信息

圖說:長三角「人工智慧+」產業創新聯合體正式成立 採訪對象提供(下同)2024世界人工智慧大會(WAIC 2024)今天在上海開幕。大會期間,在「長三角協同創新AI新質生產力發展論壇」上,T3出行成為首批加入長三角「人工智慧+」產業創新聯合體的企業;T3出行CEO崔大勇現場分享了AI推動交通出行智能化、協同化的具體應用和未來...
小猿學練機攜最新AI大模型應用成果亮相世界人工智慧大會 - 天天要聞

小猿學練機攜最新AI大模型應用成果亮相世界人工智慧大會

鞭牛士 7月4日消息,2024世界人工智慧大會(以下簡稱「大會」)在上海世博展覽館盛大開幕。本屆大會集中展示了全球「人工智慧+」領域的創新應用與前沿成果。猿力科技旗下墨水屏學習平板小猿學練機亮相大會,首次展現了AI大模型與墨水屏平板在教育領
【新機】小米15 Pro曝光,大電池+影像升級 - 天天要聞

【新機】小米15 Pro曝光,大電池+影像升級

今天網上曝光了小米15 Pro的電池信息,新機也將採用超大硅碳負極電池,這也是下半年手機市場的一個大趨勢了,硅碳負極電池具有更高的能量密度,相同體積容量更大。新機的電池容量提升到了5400mAh,要知道上代小米14 Pro的容量才4880mAh,也算是一個比較大的升級了,快充也保持在了百瓦級別,無線充應該和上代一樣維持在50W...
三十向新·聯通先鋒 | 「蠻霸」向新,為數智三湘 - 天天要聞

三十向新·聯通先鋒 | 「蠻霸」向新,為數智三湘

「中國結」聯通三湘情。站在2024,回望30年前,一條傳輸速率為64K的國際專線,全功能接入國際互聯網,中國從此開啟了一個波瀾壯闊的互聯網時代。30年日新月異,接入國際互聯網的中國,經濟社會蓬勃發展,從網路大國闊步邁進網路強國。乘勢互聯網高速發展的東風,1997年,中國聯通在湖南成立分公司,自此,湖南聯通敢為人先...