文/王新喜
馬斯克的人工智能初創公司xAI發布了更新版Grok 3大模型,馬斯克稱之為“地球上最聰明的人工智能”。
Grok 3是用20萬塊英偉達芯片練出來的,運算能力是上代10倍。
xAI在當天的直播中,馬斯克與該公司的三位工程師一起進行了現場演示,Grok 3在數學、科學和編程基準測試中,Grok 3擊敗了谷歌Gemini、DeepSeek的V3模型、Anthropic的Claude和OpenAI的GPT-4o。
據馬斯克此前介紹,Grok 3是在大量的合成數據上訓練的。它會反覆檢查數據,試圖達到邏輯一致性。如果有錯誤的數據,它會反思並刪除錯誤數據。
從目前測試看,Grok3在AIME'24數學能力測試、GPQA科學知識評估、LCB Oct - Feb編程能力測試等多項測試中成績均高於DeepSeek。擁有“思維鏈”推理機制,能像人類一樣逐步拆解複雜任務。參數量達1萬億級別。
Grok3 確實在不少任務上表現得很棒,例如在處理複雜邏輯和推理任務時,它的能力確實有東西。不過Grok3用海量GPU刷了榜單上的分數,數學、編程分高,其實也沒好多少,沒有拉開差距。而DeepSeek 的優勢在於中文理解和多模態交互方面,它的表現一直很穩定,在實際應用場景中已經得到了不少驗證。
最關鍵的問題在於,Grok3成本極其高,計算量是前代Grok 2的10倍,有說法是其訓練成本就30億美元,根據相關工程師透露xAI旗下超算中心算力已經翻倍。
去年4月,馬斯克認為xAI若想成功打造出最佳AI,唯一途徑是自建數據中心。由於想儘快推出Grok 3,時間緊迫,於是決定在四個月內建成數據中心。最終,團隊耗時122天讓第一批10萬個GPU啟動並運行,不過要構建理想中的AI需將集群規模翻倍。發布會上透露,團隊僅用92天就已經實現了超算集群的算力翻倍,也就是GPU數量已達20萬塊。
20萬塊GPU多少錢?以英偉達H100為例,單卡價格約為2.5萬-3萬美元。20萬塊 × 3萬美元 = 60億美元(僅硬件採購成本)。這還只是GPU硬件成本,實際部署成本更高,還需考慮配套服務器、網絡設備、電力、冷卻設施等,總成本可能達百億美元量級,砍一半也高達50億美金。
Deepseek從訓練成本來看僅有600萬美元,遠低於GPT-4的7800萬美元。後續deepseek資金、人才、資源上去了,綜合能力肯定不比Grok3差。
Grok 3,印證了DeepSeek真的強
這說明了什麼,說明了兩點,其一,馬斯克花了那麼多錢堆了比OpenAI還多的算力,最後搞出來個跟OpenAI差不多的產品。第二,這證明了DeepSeek真的強啊,馬斯克大把燒美金當柴火搞煉丹,效果全靠堆硬件,而且從數據來看,和DeepSeek並沒有拉開多少差距,DeepSeek那邊走低成本路線都能差不多打平手,那隻能更說明DeepSeek非常強。
因為這是兩條不同的路線,一個是力大拍磚大力出奇蹟堅定地砸錢堆算力,一個是創新的工程設計與高效的訓練方法,優化節省資源追求極致性價比,是兩條完全不同的路線。
而堆算力的遊戲,是讓AI成為美國人主導算力資源分配的遊戲。美國可以通過控制GPU芯片出口,精確調控全球AI生產力水平。並且把全球獲取AI算力劃分為三個等級圈,由它來控制分配,這讓其他國家陷入絕望。
而且特朗普還投資5000億美元的“星際之門”,目的就是將AI領先牢牢鎖在美國本土,吸引把日韓、中東、歐洲等相關資金,把除中國外的其他實力國家牢牢綁在老美的AI戰車之上。
而DeepSeek則打破了這種主導,給了其他所有國家看到了自主發展AI的希望,因為它在實現OpenAI模型的同等性能時,僅需要對方5%的算力,以低成本模式直接掀翻了美國一眾科技巨頭,這下所有的國家都覺得自己都能行了。因為,這意味着所有的國家都不需要依賴美國高算力GPU芯片資源了,而且還能把成本極大的降下來。
這是現在到處搞錢的特朗普特別看重的能力,DeepSeek的橫空出世,為啥不光是英偉達、AMD等企業很快接入,特朗普也一反常態的點贊——他們就一個意思:省成本,省社會總成本,可以給整個國家省下老鼻子錢了。
而且在AI 大模型發展到現在,其實模型能力已經很難分出絕對的勝負了,在大指標不斷趨同的背景下,開源才是大招,知名投資人朱嘯虎曾經提出一個判斷,開源模型的基礎就是閉源模型的斬殺線,今後閉源模型必須要做到開源基礎的兩到三倍才有活下去的機會。否則十倍成本砸下去性能只提高20%,那即使是硅谷的投資人也不會接受這樣的結果。
而真用起來如何,也只有開源的才能比較充分測試。不開源,人家還交錢用,還沒什麼特別領先的,商業模式就很難成立。
加上有Chatgpt和deepseek的巨大成功在前,grok1和grok2差不多無人問津,grok3單純砸錢堆算力實現大火上演反轉劇情的幾率並不大。
如果不開源,馬斯克巨大的投入無法變現,或會自用到自己的機器人和 FSD。不過話說回來,目前特斯拉FSD用戶訂閱並不高,但是Grok-3還是能增強FSD的競爭力。
因為Grok 3 基於10萬塊英偉達 H100 芯片訓練,每秒可處理超過 1.5 萬億參數,能實時解析車載攝像頭、雷達等傳感器數據,比競品在識別暴雨天氣下道路積水深度的準確率高 37%,可幫助自動駕駛系統更精準地感知周邊環境。
此外是Grok 3 引入 “思維鏈” 技術,可模擬人類逐步推理過程,在導航時能綜合分析實時交通數據、充電樁可用性和用戶日程推薦路線,在自動駕駛場景中,面對複雜路況和交通信號時能做出更合理、安全的決策。
如果特斯拉將其用到FSD,這意味着新能源車企的智駕競爭會更加激烈,對此中國的車企要有足夠的認知與準備。
相對於Grok3,deepseek的優勢是創新的工程設計與算法優化實現的超低成本、其次是開源模式的生態與技術優化能力會讓未來包括美國在內的很多科研人員只能在東大的AI模型上搞開發了!東大有望成為世界AI的開發中心。加上我們舉國之力支持,中國成百上千行業都在快速接入,促進它不斷進化,和千行百業結合實踐,產生生產力。未來發展潛力,可能不是Grok3能比的,我們拭目以待。
作者:王新喜 TMT資深評論人 本文未經許可謝絕轉載