AI行業2024年的宏大敘事：把省錢貫徹到底

2024年04月07日16:45:22 科技 1386

AI領域，曾經是一擲千金的豪賭，如今卻變成了捉襟見肘的較量。當賈揚清點贊華人團隊JetMoE大模型以10萬美元成本媲美數十億美元的LLaMA2時，人們才驚覺：原來AI也可以這麼省錢！而這背後的功臣，正是默默無聞的MoE架構。

MoE，這個曾經被輿論邊緣化的技術，如今卻站在了AI的風口浪尖。人們突然發現，這個看似不起眼的架構，竟能像一把鋒利的劍，直插AI成本的軟肋。它就像一位低調的劍客，在AI江湖中默默修鍊，終於等來了大放異彩的時刻。

全球AI圈都在為資金短缺而發愁，無論是矽谷巨頭還是中國新秀，都在這場資金大戰中捉襟見肘。大模型就像個「碎鈔機」，讓人望而生畏。而MoE架構的出現，就像一道曙光，照亮了AI企業前行的道路。

MoE架構的神奇之處在於，它能在保證性能的同時，大幅降低訓練和推理成本。開發者可以在巨型模型上橫向擴展，增加參數量，而不需要承擔高昂的成本。同時，MoE架構還可以選擇只啟用部分專家子模型，實現性能與成本的平衡。這種靈活性和可擴展性，讓MoE架構成為了AI企業的救星。

然而，MoE架構並非完美無缺。它的訓練難度很大，尤其是如何保證每個「專家」都能得到充分訓練，這是一個棘手的問題。門控網路的選擇和樣本分配的不平衡，都可能影響模型的訓練效果和最終性能。但即便如此，MoE架構依然是當前AI領域最具潛力的技術之一。

對於國內AI企業而言，MoE架構更是意義非凡。在晶元和資金雙重壓力下，國內企業急需一種能夠降低成本、提高效率的解決方案。而MoE架構正好滿足了這一需求。國內已經有一些企業開始嘗試應用MoE架構，並取得了不錯的進展。MiniMax作為最早發力MoE架構的企業之一，已經獲得了頭部資本的認可和投資。而APUS聯合新旦智能訓練的大模型APUS-xDAN更是宣布即將開源，為行業提供了更多的選擇和可能性。