微軟發布「LeMa」:一種仿照人類解決問題的革命性AI學習方法

來自微軟亞洲研究院的研究人員開發了一種新技術,通過讓大型語言模型(LLM)學習並糾正錯誤,從而改善它們解決數學問題的能力,類似於人類的學習方式。

研究人員提出了一項開創性的策略,名為「從錯誤中學習(LeMa)」,該策略訓練AI來自行糾正錯誤,從而提高了推理能力。


此外,WizardMath和MetaMath等專業法學碩士也受益於 LeMa,在 GSM8K 上實現了 85.4% 的 pass@1 準確率,在 MATH 上實現了 27.1% 的準確率。這些結果超越了非執行開源模型在這些具有挑戰性的任務上所取得的最先進的性能。

這一突破不僅僅意味著人工智慧模型推理能力的增強,也標誌著人工智慧系統向「可以像人類一樣從錯誤中學習和改進」的方向邁出了重要一步。

深遠的影響和未來發展方向

該團隊的研究成果,包括代碼、數據和模型,現已在 GitHub 上公開。這種開源方法鼓勵更廣泛的AI社區繼續這一探索方向,推動機器學習的進一步發展。

LeMa的出現代表了AI領域的一個重要里程碑,表明機器的學習過程可以更加類似於人類的學習。

這一發展可能會徹底改變嚴重依賴AI的行業,如醫療保健、金融和自動駕駛汽車,在這些領域中,錯誤糾正和持續學習至關重要。

隨著AI領域的快速發展,集成類似人類學習的過程,如從錯誤中學習,似乎是發展更高效和有效的AI系統的一個重要因素。