來自微軟亞洲研究院的研究人員開發了一種新技術,通過讓大型語言模型(LLM)學習並糾正錯誤,從而改善它們解決數學問題的能力,類似於人類的學習方式。
研究人員提出了一項開創性的策略,名為“從錯誤中學習(LeMa)”,該策略訓練AI來自行糾正錯誤,從而提高了推理能力。
此外,WizardMath和MetaMath等專業法學碩士也受益於 LeMa,在 GSM8K 上實現了 85.4% 的 pass@1 準確率,在 MATH 上實現了 27.1% 的準確率。這些結果超越了非執行開源模型在這些具有挑戰性的任務上所取得的最先進的性能。
這一突破不僅僅意味着人工智能模型推理能力的增強,也標誌着人工智能系統向“可以像人類一樣從錯誤中學習和改進”的方向邁出了重要一步。
深遠的影響和未來發展方向
該團隊的研究成果,包括代碼、數據和模型,現已在 GitHub 上公開。這種開源方法鼓勵更廣泛的AI社區繼續這一探索方向,推動機器學習的進一步發展。
LeMa的出現代表了AI領域的一個重要里程碑,表明機器的學習過程可以更加類似於人類的學習。
這一發展可能會徹底改變嚴重依賴AI的行業,如醫療保健、金融和自動駕駛汽車,在這些領域中,錯誤糾正和持續學習至關重要。
隨着AI領域的快速發展,集成類似人類學習的過程,如從錯誤中學習,似乎是發展更高效和有效的AI系統的一個重要因素。
“微軟發布“LeMa”:一種仿照人類解決問題的革命性AI學習方法”相關視頻
-
11:14
-
22:37
-
21:58
-
4:30
-
14:14
-
7:25
-
24:01
-
13:28
-
13:22
-
2:57:05
科技分類資訊推薦
科技分類視頻推薦