AI行業2024年的宏大敘事:把省錢貫徹到底

2024年04月07日16:45:22 科技 1386


AI領域,曾經是一擲千金的豪賭,如今卻變成了捉襟見肘的較量。當賈揚清點贊華人團隊JetMoE大模型以10萬美元成本媲美數十億美元的LLaMA2時,人們才驚覺:原來AI也可以這麼省錢!而這背後的功臣,正是默默無聞的MoE架構。


MoE,這個曾經被輿論邊緣化的技術,如今卻站在了AI的風口浪尖。人們突然發現,這個看似不起眼的架構,竟能像一把鋒利的劍,直插AI成本的軟肋。它就像一位低調的劍客,在AI江湖中默默修鍊,終於等來了大放異彩的時刻。


AI行業2024年的宏大敘事:把省錢貫徹到底 - 天天要聞

全球AI圈都在為資金短缺而發愁,無論是矽谷巨頭還是中國新秀,都在這場資金大戰中捉襟見肘。大模型就像個「碎鈔機」,讓人望而生畏。而MoE架構的出現,就像一道曙光,照亮了AI企業前行的道路。


MoE架構的神奇之處在於,它能在保證性能的同時,大幅降低訓練和推理成本。開發者可以在巨型模型上橫向擴展,增加參數量,而不需要承擔高昂的成本。同時,MoE架構還可以選擇只啟用部分專家子模型,實現性能與成本的平衡。這種靈活性和可擴展性,讓MoE架構成為了AI企業的救星。


然而,MoE架構並非完美無缺。它的訓練難度很大,尤其是如何保證每個「專家」都能得到充分訓練,這是一個棘手的問題。門控網路的選擇和樣本分配的不平衡,都可能影響模型的訓練效果和最終性能。但即便如此,MoE架構依然是當前AI領域最具潛力的技術之一。


對於國內AI企業而言,MoE架構更是意義非凡。在晶元和資金雙重壓力下,國內企業急需一種能夠降低成本、提高效率的解決方案。而MoE架構正好滿足了這一需求。國內已經有一些企業開始嘗試應用MoE架構,並取得了不錯的進展。MiniMax作為最早發力MoE架構的企業之一,已經獲得了頭部資本的認可和投資。而APUS聯合新旦智能訓練的大模型APUS-xDAN更是宣布即將開源,為行業提供了更多的選擇和可能性。


AI行業2024年的宏大敘事:把省錢貫徹到底 - 天天要聞

當然,並不是所有企業都選擇擁抱MoE架構。有些企業選擇了另一條路:開發小模型。面壁智能發布的端側模型Minicam就是一個例子。他們追求的是更合理的訓練方式,而不是單純的堆模型參數量。這種思路雖然與MoE架構不同,但同樣是為了降低成本、提高效率。


在這場AI省錢大作戰中,MoE架構無疑成為了最耀眼的明星。它以其獨特的優勢和潛力,為AI企業帶來了新的希望和機遇。但同時,我們也應該清醒地認識到,MoE架構並非萬能的解決方案。它也有自己的局限性和挑戰。未來,我們還需要不斷探索和創新,尋找更多適合AI發展的技術和路徑。

科技分類資訊推薦

長安與東風重組新進展:朱華榮稱不會改變長安既定戰略 - 天天要聞

長安與東風重組新進展:朱華榮稱不會改變長安既定戰略

2月9日,長安汽車和東風集團股份(00489.HK)同步發布了控股股東「正在與其他國資央企集團籌劃重組事項」的信息。長安汽車的控股股東是兵裝集團,而東風集團股份的控股股東是東風公司。隨即,長安汽車和東風集團這兩家汽車央企將合併重組,成為業內關注的焦點。
公安部出手了!年齡限制放寬10年、送考下鄉,2025年考駕照不難了 - 天天要聞

公安部出手了!年齡限制放寬10年、送考下鄉,2025年考駕照不難了

電動車加強管理以後,要求機動車類型的車輛需要持證上路,但是老年人考駕照卻受阻,一方面有年齡的限制,另一方面偏遠山區考駕照不方便,所以在2025年公安部出手了,年齡限制放寬10年,同時推出送考下鄉服務,還進一步的降低考駕照的費用,2025年起考摩托車駕照不難了。
從「星靈安全守護體系」到昊鉑HL,看懂廣汽科技日 - 天天要聞

從「星靈安全守護體系」到昊鉑HL,看懂廣汽科技日

發布會以技術切入,並全程圍繞安全展開。廣汽集團董事長、總經理馮興亞率先登場,宣布2025年四季度將正式上市支持L3級智能駕駛的車型,他同時強調面向自動駕駛時代對智能駕駛技術、整車安全架構以及突發風險處理能力的要求更高。如何才能滿足更高的要求?馮興亞提到了「廣汽
關稅大棒下,最受傷的車企出現了 - 天天要聞

關稅大棒下,最受傷的車企出現了

特朗普的關稅大棒剛揮出,尚未嚇退「外敵」,卻先刺痛了自己。近日,擁有瑪莎拉蒂、Jeep等14個品牌的全球第四大車企斯泰蘭蒂斯突然宣布裁撤900名美國工人,關閉加拿大和墨西哥兩家工廠,北美生產線陷入癱瘓。幾乎同一時間,捷豹路虎宣布暫停對美出口一個月,奧迪更是直接