
本文來自微信公眾號:字母榜,作者:彥飛,編輯:王靖,題圖來自:Unsplash
過去一個月,DeepSeek以大約十分之一的訓練成本,推出與OpenAI o1性能接近的開源模型R1,「小力出奇蹟」的新範式震撼全球AI大模型行業。同時,外界對於大型科技公司動輒數百億美元的AI研發開支,也產生了越來越多的質疑。
但被「DeepSeek衝擊」嚇了一跳的科技巨頭,並沒有因此改弦更張。相反,他們正揮舞著支票簿,試圖靠瘋狂砸錢,重新奪取AI大模型的制高點。
2月5日,谷歌母公司Alphabet發布2024年第四季度財報,營收和凈利潤均實現兩位數百分比的同比增長。引人注目的是,Alphabet宣布,2025財年的資本支出將達到750億美元(約合人民幣5454億元),以繼續擴展其人工智慧戰略。
一年投入750個「小目標」研發AI,遠遠超出了華爾街599.4億美元的預期。不過,谷歌有實力如此燒錢:截至去年底,它持有現金、現金等價物及有價證券約957億美元。
稍早時候,谷歌還向AI明星創業公司Anthropic追加投資10億美元。2023年至今,谷歌向這家公司累計投資35.5億美元。
財大氣粗的谷歌投身AI燒錢競賽,其他科技巨頭也不遑多讓。
今年1月初,微軟宣布將於2025財年投資800億美元,建設AI數據中心。這筆投資創下了微軟成立以來的單筆投資最高紀錄。而在上一財年,微軟的資本支出超500億美元,大部分用於AI相關的基礎設施。
社交網路巨頭Meta在1月底宣布,公司將在今年投資600億~650億美元,並大幅擴張AI團隊,以期實現Meta AI服務10億人、Llama 4成為行業領先大模型的目標。Meta創始人扎克伯格稱,今年將是「AI決定性的一年」。
OpenAI則拉上軟銀、甲骨文、微軟、ARM、英偉達以及中東人工智慧基金(MGX)等產業和投資巨頭,預計投資5000億美元,聯手成立「星際之門」,這些資金將被用於數據中心等AI基礎設施的建設與運營。
相比之下,國內科技巨頭面向AI大模型的砸錢規模小了一個數量級,但也動輒數百億元,且增長很快。
根據財報等公開信息,2024年前三季度,百度、阿里、騰訊的總資本開支約為人民幣867億元。金融數據服務商Visible Alpha預計,到2027年,BAT的資本支出將達到1767億元,年複合增長率超26%。考慮到BAT的重視程度,這些資本開支將有很大一部分流向AI大模型。
不難看出,科技巨頭髮展AI大模型,砸錢仍然是基本武器之一。儘管DeepSeek證明了「小力出奇蹟」的可行性,但巨頭們出於多種原因,仍然沿著「大力出奇蹟」的路線前行。
這並非僅僅是大公司的慣性使然。OpenAI剛剛發布的o3-mini,已經在物理推理等多項指標上反超R1,而更強大的o3標準版也已經箭在弦上。這也再次證明,「尺度定律」仍然是AI大模型的基本規則之一,而「小力出奇蹟」並非置之四海而皆準。
尚未找到「金主爸爸」的DeepSeek,在算力、數據、資金和資源方面比不上巨頭,正面臨被後來者強行超車的危險。不過,R1的成功,也證明了「小力出奇蹟」的可行性。在DeepSeek震動全球AI圈後,巨頭青睞的「砸錢」與「小力出奇蹟」的路線之爭仍在繼續,遠未分出勝負。
一
面對快速崛起的DeepSeek,美國科技巨頭表面上對其技術、產品和方法論讚嘆不已,但在戰略層面上,並沒有對其「小力出奇蹟」的策略亦步亦趨。
恰恰相反,在DeepSeek席捲全球AI大模型領域後,巨頭們的砸錢邁向了新高度。
以OpenAI為例,奧特曼起初對於DeepSeek有所懷疑,稱「並不新穎,我們早已具備這一水平的模型」,且「被嚴重誇大了」。OpenAI甚至在1月底表示,DeepSeek涉嫌使用OpenAI專有模型訓練自己的模型,違反了OpenAI的服務條款。
但在短短几天后,奧特曼宣布沒有計划起訴DeepSeek,同時稱讚「DeepSeek是一個令人印象深刻的模型」。在推出最新的o3-mini模型後,奧特曼甚至表示,在開源方面,OpenAI一直站在「錯誤的一邊」。
DeepSeek大紅大紫,逼得奧特曼前倨後恭、低頭認錯,此情此景讓不少人感到驚訝和振奮。但事實上,OpenAI無論是產品還是戰略,都沒有被DeepSeek這隻「黑天鵝」所打亂。
1月底,OpenAI推出o3-mini,並首次向免費用戶開放推理模型。測試表明,o3-mini相比上一代o1模型進步極大,多項基準測試表現優異;特別是面對高難度的物理模擬項目——如球體碰撞等,展現出對於R1及其他模型的碾壓實力。
幾天後,OpenAI又以o3模型為基礎發布了Deep Research功能,號稱可以在幾十分鐘內完成人類專家數小時的工作。在涵蓋超3000道問題的綜合測試「人類最後一場考試」中,Deep Research實現了26.6%的正確率,遠超DeepSeek R1的9.4%。
o3-mini採用了許多與R1相同的技術,比如強化學習(RL)、稀疏化MoE、大量監督微調(SFT)等,最終成果也堪稱驚艷。然而,Open並沒有在研發範式上向DeepSeek靠攏,而是繼續沿著「氪金」的路線狂飆。
就在拿出o3-mini對陣DeepSeek R1的同時,OpenAI高調宣布了5000億美元的「星際之門」計劃。該計劃將在全美國打造20座超算中心;首期將投資1000億美元,在得州建設10座數據中心。
儘管奧特曼的「一生之敵」馬斯克火速趕來嘲諷,信誓旦旦地說「他們沒有錢」,但星際之門的進展速度頗為驚人。計劃公開幾天後,奧特曼就曬出了「1號站點」的照片,稱之為「宏偉而美麗的建築」。
儘管星際之門得到了軟銀和甲骨文的鼎力支持,且去年營收已經高達37億美元,OpenAI仍在繼續儲備資金。
據報道,OpenAI正尋求以3400億美元估值融資400億美元,軟銀有望領投。而在短短三個月前,OpenAI剛剛以1570億美元的估值,融到了66億美元。
奧特曼彷彿患上「資金短缺恐懼症」,一邊瘋狂融資,一邊大手筆花錢。與之正面PK的其他科技巨頭,砸錢同樣毫不手軟。
今年,谷歌、微軟、Meta等均計劃投入數百億美元發展AI,力度之大遠超華爾街預期。以Meta為例,扎克伯格計劃斥資至少600億美元,建設一座擁有130萬塊GPU的AI數據中心。
作為對比,據科技諮詢公司Omdia測算,位元組去年買了23萬塊GPU,且為性能較弱的英偉達特供版。即便如此,這一數字也遠遠超出了DeepSeek目前持有的晶元規模。
二
除了海外科技巨頭,國內互聯網公司也在AI大模型領域投入巨資。DeepSeek的「小力出奇蹟」,並沒有改寫這一局面。
一度在AI大模型領域落後的位元組,近兩年灑下重金。浙商證券在一份報告中稱,2024年位元組資本開支約800億元,接近BAT的總和。
另有報道稱,位元組2025年資本開支將超1500億,大部分用於AI。位元組方面隨後否認了這一說法。
此外,位元組持續「掃貨」國內AI領域的頂級人才。據「財經天下」報道,位元組某些AI方向的業務團隊在招募知名院校的博士應屆生時,年薪可達兩三百萬元,遠超其他大廠的100萬元左右。此外,張一鳴還親自從阿里等對手那裡挖人。
除了研發費用和人才成本,過去一兩年,位元組在B端和C端同時為AI燒錢,力圖爭奪更多企業和個人用戶。
在B端,豆包大模型自去年5月發布之後不斷降價,堪稱國內AI大模型圈子的「價格屠夫」。據統計,豆包文字大模型比行業便宜99.3%,去年12月發布的視覺理解模型比行業便宜85%。
同時,在C端,豆包也在廣泛投流拉新。據AppGrowing統計,去年4~5月,豆包投放金額預計為1500萬~1750萬元。6月上旬,豆包啟動新一輪投放活動,投放金額高達1.24億元。
在猛砸資金後,豆包的用戶量猛增,成為國內用戶最多的大模型應用。
阿里同樣在AI大模型領域持續投入大筆資金。今年總台春晚,阿里雲成為雲計算AI獨家合作夥伴。僅2024年上半年,阿里在AI基礎設施上的資本支出就達到230億元。此外,阿里花費超百億元,投資AI創業公司「六小虎」。
騰訊方面,過去六年其研發總投入超2850億元,其中很大一部分投向了AI。而在AI「六小虎」中,騰訊投資了其中五家。
僅就花錢力度而言,新BAT比不過谷歌、Meta、OpenAI,但依然是國內AI大模型圈獨一檔的存在。相比之下,一直沒有融資的DeepSeek,仍然靠母公司幻方量化輸血;但國內量化投資近年來處於行業谷底,DeepSeek能夠得到的資金支持恐怕不會很多。
不過,面對DeepSeek的強勢崛起,新BAT在繼續大手筆投錢的同時,也試圖伸出橄欖枝、構建「雙保險」。
1月底、2月初,國內主要雲服務廠商均宣布接入DeepSeek大模型。阿里雲宣布支持雲上一鍵部署V3和R1,百度智能雲、騰訊雲、位元組旗下火山引擎等也先後宣布了類似功能。
眾所周知,DeepSeek採用了最「慷慨」的開源協議,並不限制第三方對於自家開源模型的商用。阿里雲等廠商第一時間接入DeepSeek大模型,能夠借著後者的潑天流量,為自己爭取一波關注度和新用戶。
另一方面,向DeepSeek伸出橄欖枝,也側面表明了大廠的心態:即便DeepSeek與自家AI業務存在競爭,也不妨先為我所用,並從中獲得技術、產品等方面的啟發。這些主動示好的舉動,也為雙方未來更大規模的合作留下了想像空間。
三
DeepSeek以「小力出奇蹟」揚名天下,但目前為止,這一頗為性感的新範式並未得到國內外大廠的全面認可與接納。砸錢、砸資源的「大力出奇蹟」,依然是大廠參與AI大模型競爭的主要打法。
與此同時,隨著競爭對手以新一代模型反擊,疊加自身規模擴大導致的種種問題,DeepSeek正面臨被全面反超的危險。
從產品上看,越來越多的用戶發覺,DeepSeek的大模型幻覺頻繁出現。無論是談論從A到B的最佳路線,還是解析某一首歌曲,或分析某一專業話題,DeepSeek都存在較為嚴重的「一本正經地胡說八道」問題。
大模型的幻覺問題一直廣泛存在,也是整個AI圈子始終未能克服的難題。DeepSeek在這方面並沒有展現比其他模型更出色的性能,這折射出僅靠大模型工程層面的創新,並不足以攻克更基礎的AI難題。
另一方面,短時間內瘋狂湧入的全球用戶,也讓DeepSeek有些力不從心。
據統計,DeepSeek自上線各大應用商店以來,短期內獲得1600萬次下載,登頂140個應用市場,最高日活躍用戶突破2200萬。由於用戶太多,DeepSeek的深度思考和聯網搜索功能一度暫時停止服務。
這也表明,「小力出奇蹟」或許可以大幅節約模型訓練的成本,但在模型投入使用後,必要的基礎設施成本仍然無法壓減。
從商業角度來看,AI大模型註定是一門規模越大、能力越強、成本越高的生意。巨頭們堅守「尺度定律」,其根基——算力、演算法和數據三角模型依然穩固。
在DeepSeek崛起的過程中,一個被不少人忽視的問題是,R1的推理性能與o1不相上下,但在許多基準測試中不如o1。而箭在弦上的o3「滿血版」,綜合性能遠超o1。和同期其他對手相比,比如谷歌的Gemini 2.0 Flash,R1也並非全面領先,而是與對手各擅勝場。
在專業人士眼中,R1的真正價值是,通過多種技術創新——比如強化學習、GRPO演算法框架、DeepSeek MOE等,再加上優秀的工程思想,以較低成本在部分指標接近或超越了行業最強大模型。DeepSeek的「小力出奇蹟」固然驚艷,但從來不是性能最強的大模型。
OpenAI剛發布的o3-mini,在許多測試中已經反超R1,也讓國外巨頭繼續狂砸錢有了更堅實的證明。這表明,除了優秀的人才、出色的演算法外,強大的算力、豐富的數據,也是構建更強大模型,乃至通往AGI的必經之路。
DeepSeek「小力出奇蹟」證明了AI大模型的另一條發展路徑,卻並非唯一的路徑。手握重金的科技巨頭,依然是AI大模型的主要參與者,同時也是DeepSeek繼續上攻的強大對手。
AI大模型遠未分出勝負,DeepSeek及其擁躉不能「半場開香檳」。而高性價比路線與「大力出奇蹟」路線之爭,也仍將持續下去,並在互相借鑒和融合中,推動AI大模型邁向下一個發展階段。
參考資料:
APPSO,《萬字揭秘DeepSeek:頂尖AI人才年薪千萬,訓練成本被低估》
亂彈山,《我確實低估了DeepSeek所引發的大面積「AI幻覺」》
億歐網,《特朗普孫正義組局,預砸5000億美金建「星際之門」》
IT之家,《Meta宣布將打造擁有 130 萬顆 GPU 的 AI 數據中心》
新智元,《o3-mini物理推理粉碎DeepSeek R1,OpenAI王者歸來!全網最全實測》
本文來自微信公眾號:字母榜,作者:彥飛,編輯:王靖
本內容為作者獨立觀點,不代表虎嗅立場。未經允許不得轉載,授權事宜請聯繫 [email protected]
正在改變與想要改變世界的人,都在 虎嗅APP