讓 AI 模型互相教學,谷歌推出社會學習框架

it之家 3 月 11 日消息,谷歌近日公開了一項名為「社會學習(social learning)」的 ai 框架,該框架允許 ai 語言模型能夠通過自然語言互相學習,由於不需要直接交換敏感關鍵信息,因此訓練出的 ai 模型更具隱私保護性。

據介紹,在這款「社會學習框架」中,「學生模型」會向多個已知特定任務解法的「教師模型」學習各種問題的解決方案,研究人員設計了「垃圾短訊檢測」、「解決小學數學問題」、「根據特定文字回答問題」等多項測試,來評估相關「社會學習」框架的成效。

研究人員表示,部分 ai 模型只經過短暫的「社會學習」框架訓練,便能夠能獲得良好的任務解決能力。在研究人員的「垃圾短訊檢測任務」中,教師模型首先從用戶所標記的數據學習,而在教師獲得檢測垃圾信息知識後,便可以教會學生模型區分垃圾和非垃圾信息。

▲ 圖源 谷歌官方新聞稿

it之家注意到,相關教師模型可以依據實際數據集,合成出新的範例與學生模型共享,合成數據集與原始數據完全不同,因此能在保證起到相同教育作用的同時,降低原始數據中隱私內容泄露的可能性。

研究人員還嘗試了合成指令的方式,讓教師模型針對特定任務生成一系列指令,學生模型依據教師模型指令學習執行任務的方式,有點類似「人類遵循他人口頭指令做事,並在執行任務中掌握如何做事」。

而實驗證明,相關教師模型生成的指令能夠提高學生模型執行任務的效率,相比於零樣本學習,研究人員認為,這顯示出 ai 模型在遵循指令方面的強大能力。