讓 AI 模型互相教學,谷歌推出社會學習框架

it之家 3 月 11 日消息,谷歌近日公開了一項名為“社會學習(social learning)”的 ai 框架,該框架允許 ai 語言模型能夠通過自然語言互相學習,由於不需要直接交換敏感關鍵信息,因此訓練出的 ai 模型更具隱私保護性。

據介紹,在這款“社會學習框架”中,“學生模型”會向多個已知特定任務解法的“教師模型”學習各種問題的解決方案,研究人員設計了“垃圾短信檢測”、“解決小學數學問題”、“根據特定文字回答問題”等多項測試,來評估相關“社會學習”框架的成效。

研究人員表示,部分 ai 模型只經過短暫的“社會學習”框架訓練,便能夠能獲得良好的任務解決能力。在研究人員的“垃圾短信檢測任務”中,教師模型首先從用戶所標記的數據學習,而在教師獲得檢測垃圾信息知識後,便可以教會學生模型區分垃圾和非垃圾信息。

▲ 圖源 谷歌官方新聞稿

it之家注意到,相關教師模型可以依據實際數據集,合成出新的範例與學生模型共享,合成數據集與原始數據完全不同,因此能在保證起到相同教育作用的同時,降低原始數據中隱私內容泄露的可能性。

研究人員還嘗試了合成指令的方式,讓教師模型針對特定任務生成一系列指令,學生模型依據教師模型指令學習執行任務的方式,有點類似“人類遵循他人口頭指令做事,並在執行任務中掌握如何做事”。

而實驗證明,相關教師模型生成的指令能夠提高學生模型執行任務的效率,相比於零樣本學習,研究人員認為,這顯示出 ai 模型在遵循指令方面的強大能力。