AI行業2024年的宏大敘事:把省錢貫徹到底

2024年04月07日16:45:22 科技 1386


AI領域,曾經是一擲千金的豪賭,如今卻變成了捉襟見肘的較量。當賈揚清點贊華人團隊JetMoE大模型以10萬美元成本媲美數十億美元的LLaMA2時,人們才驚覺:原來AI也可以這麼省錢!而這背後的功臣,正是默默無聞的MoE架構。


MoE,這個曾經被輿論邊緣化的技術,如今卻站在了AI的風口浪尖。人們突然發現,這個看似不起眼的架構,竟能像一把鋒利的劍,直插AI成本的軟肋。它就像一位低調的劍客,在AI江湖中默默修鍊,終於等來了大放異彩的時刻。


AI行業2024年的宏大敘事:把省錢貫徹到底 - 天天要聞

全球AI圈都在為資金短缺而發愁,無論是硅谷巨頭還是中國新秀,都在這場資金大戰中捉襟見肘。大模型就像個“碎鈔機”,讓人望而生畏。而MoE架構的出現,就像一道曙光,照亮了AI企業前行的道路。


MoE架構的神奇之處在於,它能在保證性能的同時,大幅降低訓練和推理成本。開發者可以在巨型模型上橫向擴展,增加參數量,而不需要承擔高昂的成本。同時,MoE架構還可以選擇只啟用部分專家子模型,實現性能與成本的平衡。這種靈活性和可擴展性,讓MoE架構成為了AI企業的救星。


然而,MoE架構並非完美無缺。它的訓練難度很大,尤其是如何保證每個“專家”都能得到充分訓練,這是一個棘手的問題。門控網絡的選擇和樣本分配的不平衡,都可能影響模型的訓練效果和最終性能。但即便如此,MoE架構依然是當前AI領域最具潛力的技術之一。


對於國內AI企業而言,MoE架構更是意義非凡。在芯片和資金雙重壓力下,國內企業急需一種能夠降低成本、提高效率的解決方案。而MoE架構正好滿足了這一需求。國內已經有一些企業開始嘗試應用MoE架構,並取得了不錯的進展。MiniMax作為最早發力MoE架構的企業之一,已經獲得了頭部資本的認可和投資。而APUS聯合新旦智能訓練的大模型APUS-xDAN更是宣布即將開源,為行業提供了更多的選擇和可能性。


AI行業2024年的宏大敘事:把省錢貫徹到底 - 天天要聞

當然,並不是所有企業都選擇擁抱MoE架構。有些企業選擇了另一條路:開發小模型。面壁智能發布的端側模型Minicam就是一個例子。他們追求的是更合理的訓練方式,而不是單純的堆模型參數量。這種思路雖然與MoE架構不同,但同樣是為了降低成本、提高效率。


在這場AI省錢大作戰中,MoE架構無疑成為了最耀眼的明星。它以其獨特的優勢和潛力,為AI企業帶來了新的希望和機遇。但同時,我們也應該清醒地認識到,MoE架構並非萬能的解決方案。它也有自己的局限性和挑戰。未來,我們還需要不斷探索和創新,尋找更多適合AI發展的技術和路徑。

科技分類資訊推薦

蘋果Vision Pro頭顯新專利:屏幕位置/角度隨心調,提升佩戴舒適度 - 天天要聞

蘋果Vision Pro頭顯新專利:屏幕位置/角度隨心調,提升佩戴舒適度

【TechWeb】科技媒體PatentlyApple報道稱,蘋果公司最近獲得了一項關於Vision Pro頭顯的新專利,該專利的目的是為了提升頭顯的佩戴舒適度。這項專利的核心創新在於允許用戶根據個人偏好和需求調整屏幕的位置。專利描述顯示,這款頭顯包含一個顯示單元和一個固定帶,用戶可以通過固定帶佩戴頭顯,讓屏幕位於眼睛前方。頭顯配...
2025西門子Simcenter仿真與試驗技術峰會在皖成功舉辦 - 天天要聞

2025西門子Simcenter仿真與試驗技術峰會在皖成功舉辦

5 月 23 日,為期四天的 2025 西門子大中華區 Simcenter 仿真與試驗技術峰會在合肥圓滿落幕。大會以“工程創新,智啟未來”為主題,匯聚千餘位製造業行業精英、技術領袖,及西門子全球專家,聚焦仿真與試驗前沿技術的發展與實踐,共探人工智能 (AI) 與數字孿生雙輪驅動的數智化產業變革趨勢。 Simcenter —— 全維度仿真能...
華為鴻蒙摺疊電腦預約量達11萬 部分版本已顯示缺貨 - 天天要聞

華為鴻蒙摺疊電腦預約量達11萬 部分版本已顯示缺貨

【CNMO科技消息】據CNMO了解,截至5月22日午間,華為旗下售價23999元起的鴻蒙摺疊電腦 ——HUAWEI MateBook Fold 非凡大師預約人數達到11萬。該款摺疊電腦於5月19日在nova 14系列及鴻蒙電腦新品發布會上正式推出。華為首款鴻蒙摺疊電腦作為華為首款超薄摺疊電腦,它重1.16kg,平展薄度為7.3mm,閉合薄度為14.9mm。其
真我 Neo7 Turbo 手機搭載 7200mAh 電池 + 100W 快充 - 天天要聞

真我 Neo7 Turbo 手機搭載 7200mAh 電池 + 100W 快充

IT之家 5 月 23 日消息,真我 Neo7 Turbo 手機將於 5 月 29 日 14:00 發布,realme 官方今日確認這款新機搭載 7200mAh 泰坦電池,支持 100W 快充。除此之外,這款新機還支持全場景旁路充電,遊戲、視頻、直播等多種場景邊充邊玩。IT之家注意到,今年 2 月發布的真我 GT7 Pro 競速版手機便搭載旁路充電技術,宣稱
逆境鑄輝煌:美國打壓下小米3納米芯片橫空出世 - 天天要聞

逆境鑄輝煌:美國打壓下小米3納米芯片橫空出世

在全球科技競爭的激烈浪潮中,近年來,美國為了維持自身科技霸權地位,對中國科技企業發起了一輪又一輪的打壓,其手段不斷升級,通過技術封鎖、制裁禁令等一系列不合理舉措,妄圖遏制中國科技產業的蓬勃發展,阻礙中國科技崛起的步伐。
開源引擎Godot已為visionOS提供基本支持 - 天天要聞

開源引擎Godot已為visionOS提供基本支持

上個月,在開源遊戲引擎 Godot 的 GitHub 代碼倉庫中,發生了一件備受矚目的事情。visionOS 工程團隊里的一位蘋果員工,提交了一個規模龐大的拉取請求。這一請求意味着數千行代碼被添加到 Godot 中,專門用於實現對 visionOS 平台的支持。與此同時,該員工還正式提交書面申請,希望將這些代碼合併到 Godot 的主分支里。這一...
首發密集、消費場景上新……文博會亮點多多氣象新 - 天天要聞

首發密集、消費場景上新……文博會亮點多多氣象新

第二十一屆文博會昨日在深圳開幕,六千多家政府組團、文化機構和企業線上線下參展,比上屆增加265家。今天是文博會開幕的第二天,有哪些新品亮相?還有哪些亮點值得期待?總台央視記者 杜思源:在文博會的各個展區,都設有發布專區,每天大約有二十多場新品發布會在這裡舉行。首發密集打造文化新品超級發布平台除了專區,在...