AI行業2024年的宏大敘事:把省錢貫徹到底

2024年04月07日16:45:22 科技 1386


AI領域,曾經是一擲千金的豪賭,如今卻變成了捉襟見肘的較量。當賈揚清點贊華人團隊JetMoE大模型以10萬美元成本媲美數十億美元的LLaMA2時,人們才驚覺:原來AI也可以這麼省錢!而這背後的功臣,正是默默無聞的MoE架構。


MoE,這個曾經被輿論邊緣化的技術,如今卻站在了AI的風口浪尖。人們突然發現,這個看似不起眼的架構,竟能像一把鋒利的劍,直插AI成本的軟肋。它就像一位低調的劍客,在AI江湖中默默修鍊,終於等來了大放異彩的時刻。


AI行業2024年的宏大敘事:把省錢貫徹到底 - 天天要聞

全球AI圈都在為資金短缺而發愁,無論是硅谷巨頭還是中國新秀,都在這場資金大戰中捉襟見肘。大模型就像個「碎鈔機」,讓人望而生畏。而MoE架構的出現,就像一道曙光,照亮了AI企業前行的道路。


MoE架構的神奇之處在於,它能在保證性能的同時,大幅降低訓練和推理成本。開發者可以在巨型模型上橫向擴展,增加參數量,而不需要承擔高昂的成本。同時,MoE架構還可以選擇只啟用部分專家子模型,實現性能與成本的平衡。這種靈活性和可擴展性,讓MoE架構成為了AI企業的救星。


然而,MoE架構並非完美無缺。它的訓練難度很大,尤其是如何保證每個「專家」都能得到充分訓練,這是一個棘手的問題。門控網絡的選擇和樣本分配的不平衡,都可能影響模型的訓練效果和最終性能。但即便如此,MoE架構依然是當前AI領域最具潛力的技術之一。


對於國內AI企業而言,MoE架構更是意義非凡。在芯片和資金雙重壓力下,國內企業急需一種能夠降低成本、提高效率的解決方案。而MoE架構正好滿足了這一需求。國內已經有一些企業開始嘗試應用MoE架構,並取得了不錯的進展。MiniMax作為最早發力MoE架構的企業之一,已經獲得了頭部資本的認可和投資。而APUS聯合新旦智能訓練的大模型APUS-xDAN更是宣布即將開源,為行業提供了更多的選擇和可能性。


AI行業2024年的宏大敘事:把省錢貫徹到底 - 天天要聞

當然,並不是所有企業都選擇擁抱MoE架構。有些企業選擇了另一條路:開發小模型。面壁智能發佈的端側模型Minicam就是一個例子。他們追求的是更合理的訓練方式,而不是單純的堆模型參數量。這種思路雖然與MoE架構不同,但同樣是為了降低成本、提高效率。


在這場AI省錢大作戰中,MoE架構無疑成為了最耀眼的明星。它以其獨特的優勢和潛力,為AI企業帶來了新的希望和機遇。但同時,我們也應該清醒地認識到,MoE架構並非萬能的解決方案。它也有自己的局限性和挑戰。未來,我們還需要不斷探索和創新,尋找更多適合AI發展的技術和路徑。

科技分類資訊推薦

五菱星光2025款,10萬級600續航中級轎車的質價比王者 - 天天要聞

五菱星光2025款,10萬級600續航中級轎車的質價比王者

雖然國內車市早已變成買方市場,但是預算10萬想買一台「完美」的純電家轎,難度可不小。這個價位的電車,要麼續航里程不長、要麼車身尺寸不大、要麼舒適化和智能化配置一般,這些對於家庭用戶來說都是不能容忍的短板。
諾基亞「詐屍」了?不僅活得很好,還在「威脅」中國車企 - 天天要聞

諾基亞「詐屍」了?不僅活得很好,還在「威脅」中國車企

在過去的幾年間,人們每每提起燃油車廠商和新能源汽車廠商的對比關係,總是喜歡用諾基亞做例子,將諾基亞在智能手機從巨無霸到迅速垮塌的經歷,形容那些不求進取的燃油車企。顯然,在智能手機領域,現在的諾基亞已經完全「沉底」了,在全球市場都沒有什麼存在感了,以至於很多不太關注科技圈的小夥伴都有一個錯誤的印象,諾...
觀瀾亭|從《哪吒2》到LABUBU,這座城市被看見 - 天天要聞

觀瀾亭|從《哪吒2》到LABUBU,這座城市被看見

若是給今年以來全球最火IP排名的話,潮玩LABUBU和電影《哪吒2》及其手辦,都是毫無爭議的「頂級」。透過二者可見,中國潮玩已然成為全球潮流文化的重要力量,正突破不同的文化背景與地理界限,走向跨文化傳播。
華為Pura 80 Pro/Pro+今日首銷 售價6499元起 - 天天要聞

華為Pura 80 Pro/Pro+今日首銷 售價6499元起

站長之家(ChinaZ.com) 6月14日 消息:今日上午10:08,華為Pura80Pro和Pura80Pro+正式開啟銷售,首批在官網搶購以及線下預定的用戶將陸續拿到新機。這兩款機型在整體外觀與配置上較為相似,不過在屏幕影像規格方面存在細微差別。在屏幕玻璃材質上,Pura80Pro採用的是第二代崑崙玻璃面板,而Pura80Pro+則配備了與Ultra相
物流快遞行業  備戰英吉沙鮮杏銷售 - 天天要聞

物流快遞行業 備戰英吉沙鮮杏銷售

眼下,17.75萬畝英吉沙杏即將迎來豐收。為確保這些美味鮮果能以最佳狀態送達全國各地消費者手中,新疆英吉沙縣物流行業提前謀劃、周密部署,一場全方位的運輸保障工作正在緊鑼密鼓地籌備中。順豐鮮杏包裝盒 (娜扎凱提 攝)「當天採摘,當天轉運,當天運輸……」近日,新疆順豐速運有限公司英吉沙縣分公司內,一場關於英吉...
蘋果Liquid Glass UI影響文字可讀性並提高設計界面難度引發質疑 - 天天要聞

蘋果Liquid Glass UI影響文字可讀性並提高設計界面難度引發質疑

今年晚些時候蘋果設備即將推出的操作系統更新,將帶來該公司十多年來首次重大的用戶界面設計變革,但眼尖的觀察者會發現它與舊版 Windows 有相似之處——微軟也注意到了這一點。不過那些對蘋果即將推出的界面感到擔憂的用戶將可以選擇更改其視覺呈現
馬克龍希望說服台積電/三星在法國建立尖端設施 - 天天要聞

馬克龍希望說服台積電/三星在法國建立尖端設施

繼美國大力推動芯片生產之後,歐洲似乎是下一個,因為法國總統現在渴望將台積電和三星引入該國,以在國內獲取高端節點。隨着全球供應鏈的急劇演變,各國已將重點轉向通過在本地生產來滿足芯片需求。