DeepSeek勸不了谷歌們

2025年02月06日09:23:03 科技 1186
DeepSeek勸不了谷歌們 - 天天要聞

本文來自微信公眾號:字母榜,作者:彥飛,編輯:王靖,題圖來自:Unsplash

過去一個月,DeepSeek以大約十分之一的訓練成本,推出與OpenAI o1性能接近的開源模型R1,「小力出奇蹟」的新範式震撼全球AI大模型行業。同時,外界對於大型科技公司動輒數百億美元的AI研發開支,也產生了越來越多的質疑。

但被「DeepSeek衝擊」嚇了一跳的科技巨頭,並沒有因此改弦更張。相反,他們正揮舞著支票簿,試圖靠瘋狂砸錢,重新奪取AI大模型的制高點。

2月5日,谷歌母公司Alphabet發布2024年第四季度財報,營收和凈利潤均實現兩位數百分比的同比增長。引人注目的是,Alphabet宣布,2025財年的資本支出將達到750億美元(約合人民幣5454億元),以繼續擴展其人工智慧戰略。

一年投入750個「小目標」研發AI,遠遠超出了華爾街599.4億美元的預期。不過,谷歌有實力如此燒錢:截至去年底,它持有現金、現金等價物及有價證券約957億美元。

稍早時候,谷歌還向AI明星創業公司Anthropic追加投資10億美元。2023年至今,谷歌向這家公司累計投資35.5億美元。

財大氣粗的谷歌投身AI燒錢競賽,其他科技巨頭也不遑多讓。

今年1月初,微軟宣布將於2025財年投資800億美元,建設AI數據中心。這筆投資創下了微軟成立以來的單筆投資最高紀錄。而在上一財年,微軟的資本支出超500億美元,大部分用於AI相關的基礎設施。

社交網路巨頭Meta在1月底宣布,公司將在今年投資600億~650億美元,並大幅擴張AI團隊,以期實現Meta AI服務10億人、Llama 4成為行業領先大模型的目標。Meta創始人扎克伯格稱,今年將是「AI決定性的一年」。

OpenAI則拉上軟銀、甲骨文、微軟、ARM英偉達以及中東人工智慧基金(MGX)等產業和投資巨頭,預計投資5000億美元,聯手成立「星際之門」,這些資金將被用於數據中心等AI基礎設施的建設與運營。

相比之下,國內科技巨頭面向AI大模型的砸錢規模小了一個數量級,但也動輒數百億元,且增長很快。

根據財報等公開信息,2024年前三季度,百度、阿里、騰訊的總資本開支約為人民幣867億元。金融數據服務商Visible Alpha預計,到2027年,BAT的資本支出將達到1767億元,年複合增長率超26%。考慮到BAT的重視程度,這些資本開支將有很大一部分流向AI大模型。

不難看出,科技巨頭髮展AI大模型,砸錢仍然是基本武器之一。儘管DeepSeek證明了「小力出奇蹟」的可行性,但巨頭們出於多種原因,仍然沿著「大力出奇蹟」的路線前行。

這並非僅僅是大公司的慣性使然。OpenAI剛剛發布的o3-mini,已經在物理推理等多項指標上反超R1,而更強大的o3標準版也已經箭在弦上。這也再次證明,「尺度定律」仍然是AI大模型的基本規則之一,而「小力出奇蹟」並非置之四海而皆準。

尚未找到「金主爸爸」的DeepSeek,在算力、數據、資金和資源方面比不上巨頭,正面臨被後來者強行超車的危險。不過,R1的成功,也證明了「小力出奇蹟」的可行性。在DeepSeek震動全球AI圈後,巨頭青睞的「砸錢」與「小力出奇蹟」的路線之爭仍在繼續,遠未分出勝負。

面對快速崛起的DeepSeek,美國科技巨頭表面上對其技術、產品和方法論讚嘆不已,但在戰略層面上,並沒有對其「小力出奇蹟」的策略亦步亦趨。

恰恰相反,在DeepSeek席捲全球AI大模型領域後,巨頭們的砸錢邁向了新高度。

以OpenAI為例,奧特曼起初對於DeepSeek有所懷疑,稱「並不新穎,我們早已具備這一水平的模型」,且「被嚴重誇大了」。OpenAI甚至在1月底表示,DeepSeek涉嫌使用OpenAI專有模型訓練自己的模型,違反了OpenAI的服務條款。

但在短短几天后,奧特曼宣布沒有計划起訴DeepSeek,同時稱讚「DeepSeek是一個令人印象深刻的模型」。在推出最新的o3-mini模型後,奧特曼甚至表示,在開源方面,OpenAI一直站在「錯誤的一邊」。

DeepSeek大紅大紫,逼得奧特曼前倨後恭、低頭認錯,此情此景讓不少人感到驚訝和振奮。但事實上,OpenAI無論是產品還是戰略,都沒有被DeepSeek這隻「黑天鵝」所打亂。

1月底,OpenAI推出o3-mini,並首次向免費用戶開放推理模型。測試表明,o3-mini相比上一代o1模型進步極大,多項基準測試表現優異;特別是面對高難度的物理模擬項目——如球體碰撞等,展現出對於R1及其他模型的碾壓實力。

幾天後,OpenAI又以o3模型為基礎發布了Deep Research功能,號稱可以在幾十分鐘內完成人類專家數小時的工作。在涵蓋超3000道問題的綜合測試「人類最後一場考試」中,Deep Research實現了26.6%的正確率,遠超DeepSeek R1的9.4%。

o3-mini採用了許多與R1相同的技術,比如強化學習(RL)、稀疏化MoE、大量監督微調(SFT)等,最終成果也堪稱驚艷。然而,Open並沒有在研發範式上向DeepSeek靠攏,而是繼續沿著「氪金」的路線狂飆。

就在拿出o3-mini對陣DeepSeek R1的同時,OpenAI高調宣布了5000億美元的「星際之門」計劃。該計劃將在全美國打造20座超算中心;首期將投資1000億美元,在得州建設10座數據中心。

儘管奧特曼的「一生之敵」馬斯克火速趕來嘲諷,信誓旦旦地說「他們沒有錢」,但星際之門的進展速度頗為驚人。計劃公開幾天後,奧特曼就曬出了「1號站點」的照片,稱之為「宏偉而美麗的建築」。

儘管星際之門得到了軟銀和甲骨文的鼎力支持,且去年營收已經高達37億美元,OpenAI仍在繼續儲備資金。

據報道,OpenAI正尋求以3400億美元估值融資400億美元,軟銀有望領投。而在短短三個月前,OpenAI剛剛以1570億美元的估值,融到了66億美元。

奧特曼彷彿患上「資金短缺恐懼症」,一邊瘋狂融資,一邊大手筆花錢。與之正面PK的其他科技巨頭,砸錢同樣毫不手軟。

今年,谷歌、微軟、Meta等均計劃投入數百億美元發展AI,力度之大遠超華爾街預期。以Meta為例,扎克伯格計劃斥資至少600億美元,建設一座擁有130萬塊GPU的AI數據中心。

作為對比,據科技諮詢公司Omdia測算,位元組去年買了23萬塊GPU,且為性能較弱的英偉達特供版。即便如此,這一數字也遠遠超出了DeepSeek目前持有的晶元規模。

除了海外科技巨頭,國內互聯網公司也在AI大模型領域投入巨資。DeepSeek的「小力出奇蹟」,並沒有改寫這一局面。

一度在AI大模型領域落後的位元組,近兩年灑下重金。浙商證券在一份報告中稱,2024年位元組資本開支約800億元,接近BAT的總和。

另有報道稱,位元組2025年資本開支將超1500億,大部分用於AI。位元組方面隨後否認了這一說法。

此外,位元組持續「掃貨」國內AI領域的頂級人才。據「財經天下」報道,位元組某些AI方向的業務團隊在招募知名院校的博士應屆生時,年薪可達兩三百萬元,遠超其他大廠的100萬元左右。此外,張一鳴還親自從阿里等對手那裡挖人。

除了研發費用和人才成本,過去一兩年,位元組在B端和C端同時為AI燒錢,力圖爭奪更多企業和個人用戶。

在B端,豆包大模型自去年5月發布之後不斷降價,堪稱國內AI大模型圈子的「價格屠夫」。據統計,豆包文字大模型比行業便宜99.3%,去年12月發布的視覺理解模型比行業便宜85%。

同時,在C端,豆包也在廣泛投流拉新。據AppGrowing統計,去年4~5月,豆包投放金額預計為1500萬~1750萬元。6月上旬,豆包啟動新一輪投放活動,投放金額高達1.24億元。

在猛砸資金後,豆包的用戶量猛增,成為國內用戶最多的大模型應用。

阿里同樣在AI大模型領域持續投入大筆資金。今年總台春晚,阿里雲成為雲計算AI獨家合作夥伴。僅2024年上半年,阿里在AI基礎設施上的資本支出就達到230億元。此外,阿里花費超百億元,投資AI創業公司「六小虎」。

騰訊方面,過去六年其研發總投入超2850億元,其中很大一部分投向了AI。而在AI「六小虎」中,騰訊投資了其中五家。

僅就花錢力度而言,新BAT比不過谷歌、Meta、OpenAI,但依然是國內AI大模型圈獨一檔的存在。相比之下,一直沒有融資的DeepSeek,仍然靠母公司幻方量化輸血;但國內量化投資近年來處於行業谷底,DeepSeek能夠得到的資金支持恐怕不會很多。

不過,面對DeepSeek的強勢崛起,新BAT在繼續大手筆投錢的同時,也試圖伸出橄欖枝、構建「雙保險」。

1月底、2月初,國內主要雲服務廠商均宣布接入DeepSeek大模型。阿里雲宣布支持雲上一鍵部署V3和R1,百度智能雲騰訊雲、位元組旗下火山引擎等也先後宣布了類似功能。

眾所周知,DeepSeek採用了最「慷慨」的開源協議,並不限制第三方對於自家開源模型的商用。阿里雲等廠商第一時間接入DeepSeek大模型,能夠借著後者的潑天流量,為自己爭取一波關注度和新用戶。

另一方面,向DeepSeek伸出橄欖枝,也側面表明了大廠的心態:即便DeepSeek與自家AI業務存在競爭,也不妨先為我所用,並從中獲得技術、產品等方面的啟發。這些主動示好的舉動,也為雙方未來更大規模的合作留下了想像空間。

DeepSeek以「小力出奇蹟」揚名天下,但目前為止,這一頗為性感的新範式並未得到國內外大廠的全面認可與接納。砸錢、砸資源的「大力出奇蹟」,依然是大廠參與AI大模型競爭的主要打法。

與此同時,隨著競爭對手以新一代模型反擊,疊加自身規模擴大導致的種種問題,DeepSeek正面臨被全面反超的危險。

從產品上看,越來越多的用戶發覺,DeepSeek的大模型幻覺頻繁出現。無論是談論從A到B的最佳路線,還是解析某一首歌曲,或分析某一專業話題,DeepSeek都存在較為嚴重的「一本正經地胡說八道」問題。

大模型的幻覺問題一直廣泛存在,也是整個AI圈子始終未能克服的難題。DeepSeek在這方面並沒有展現比其他模型更出色的性能,這折射出僅靠大模型工程層面的創新,並不足以攻克更基礎的AI難題。

另一方面,短時間內瘋狂湧入的全球用戶,也讓DeepSeek有些力不從心。

據統計,DeepSeek自上線各大應用商店以來,短期內獲得1600萬次下載,登頂140個應用市場,最高日活躍用戶突破2200萬。由於用戶太多,DeepSeek的深度思考和聯網搜索功能一度暫時停止服務。

這也表明,「小力出奇蹟」或許可以大幅節約模型訓練的成本,但在模型投入使用後,必要的基礎設施成本仍然無法壓減。

從商業角度來看,AI大模型註定是一門規模越大、能力越強、成本越高的生意。巨頭們堅守「尺度定律」,其根基——算力、演算法和數據三角模型依然穩固。

在DeepSeek崛起的過程中,一個被不少人忽視的問題是,R1的推理性能與o1不相上下,但在許多基準測試中不如o1。而箭在弦上的o3「滿血版」,綜合性能遠超o1。和同期其他對手相比,比如谷歌的Gemini 2.0 Flash,R1也並非全面領先,而是與對手各擅勝場。

在專業人士眼中,R1的真正價值是,通過多種技術創新——比如強化學習、GRPO演算法框架、DeepSeek MOE等,再加上優秀的工程思想,以較低成本在部分指標接近或超越了行業最強大模型。DeepSeek的「小力出奇蹟」固然驚艷,但從來不是性能最強的大模型。

OpenAI剛發布的o3-mini,在許多測試中已經反超R1,也讓國外巨頭繼續狂砸錢有了更堅實的證明。這表明,除了優秀的人才、出色的演算法外,強大的算力、豐富的數據,也是構建更強大模型,乃至通往AGI的必經之路。

DeepSeek「小力出奇蹟」證明了AI大模型的另一條發展路徑,卻並非唯一的路徑。手握重金的科技巨頭,依然是AI大模型的主要參與者,同時也是DeepSeek繼續上攻的強大對手。

AI大模型遠未分出勝負,DeepSeek及其擁躉不能「半場開香檳」。而高性價比路線與「大力出奇蹟」路線之爭,也仍將持續下去,並在互相借鑒和融合中,推動AI大模型邁向下一個發展階段。

參考資料:

APPSO,《萬字揭秘DeepSeek:頂尖AI人才年薪千萬,訓練成本被低估》

亂彈山,《我確實低估了DeepSeek所引發的大面積「AI幻覺」》

億歐網,《特朗普孫正義組局,預砸5000億美金建「星際之門」》

IT之家,《Meta宣布將打造擁有 130 萬顆 GPU 的 AI 數據中心》

新智元,《o3-mini物理推理粉碎DeepSeek R1,OpenAI王者歸來!全網最全實測》

本文來自微信公眾號:字母榜,作者:彥飛,編輯:王靖

本內容為作者獨立觀點,不代表虎嗅立場。未經允許不得轉載,授權事宜請聯繫 [email protected]

正在改變與想要改變世界的人,都在 虎嗅APP

科技分類資訊推薦

魔法原子舉辦2025場景戰略發布會 官宣「千景共創計劃」落地1000個應用場景 - 天天要聞

魔法原子舉辦2025場景戰略發布會 官宣「千景共創計劃」落地1000個應用場景

3月26日,魔法原子舉辦「原子雙生」2025場景戰略發布會,正式推出人形機器人和四足機器人,並首次推出端到端「原子萬象大模型」,展現了具身智能技術高效賦能工業、商業等場景的全新範式。魔法原子還宣布,啟動「千景共創計劃」,將圍繞人形機器人落地,拓展1000家合作夥伴,打造1000個人形機器人落地應用場景。發布會上,...
供應鏈「泄露」問界M8真實產能公函 - 天天要聞

供應鏈「泄露」問界M8真實產能公函

一則供應鏈「追殺令」在3月26日曝光於網路,從內容截屏可以看出,問界正在「逼迫」供應鏈必須在今年5月30日之前完成目標產能,否則後果不堪設想。從問界發給供應鏈的「外協聯繫函」上可以看到,要求全供應鏈在2025年5月30日之前,將通用供應件提升至900車付/天,並要求在3月31日中午12點前,簽字回傳。如果無法做到,將請供...
2025中關村論壇奉上川味「開胃菜」 - 天天要聞

2025中關村論壇奉上川味「開胃菜」

2025中關村論壇將於3月27日在北京開幕,今晚(3月26日),論壇組委會專門為全國各地來京參加報道工作的媒體記者奉上一道川味十足的「開胃菜」,在北京地區唯一的CINITY超高清LED影院——北京中影國際黨史館影院放映了一場「成都造」電影《
文心大模型X1代碼、數學、推理能力超越最新版DeepSeek V3!即將上線千帆大模型平台 - 天天要聞

文心大模型X1代碼、數學、推理能力超越最新版DeepSeek V3!即將上線千帆大模型平台

今日,據媒體報道,在多個公開數據集測評中,百度最新發布的文心大模型X1,在數學、代碼、推理等能力上表現優異,超越升級後的DeepSeek-V3-0324。在數學場景中,GSM8K數據集測試後結果顯示,文心X1得分95.6,DeepSeek-V3-0324得分93.6;代碼生成層面,HumanEval數據集測試後結果顯示,文心X1得分90.9,DeepSeek
博鰲面對面丨專訪張亞勤:未來十年機器人的數量或將超過人類 - 天天要聞

博鰲面對面丨專訪張亞勤:未來十年機器人的數量或將超過人類

央廣網北京3月26日消息(記者孔穎)據中央廣播電視總台中國之聲報道,過去一年,各行各業大模型層出不窮,人工智慧技術正以超出預期的速度進化,而隨著大模型與更多實際場景相結合,相關應用也在悄然滲透進我們生產生活的方方面面。未來機器人數量會超過人
家人們,關於無油干泵的維護與保養,你們了解多少呢? - 天天要聞

家人們,關於無油干泵的維護與保養,你們了解多少呢?

家人們,關於無油干泵的維護與保養,你們了解多少呢?首先,對於無油干泵的清理,我們需要知道它是如何工作的。無油干泵利用空開運行抽掉泵內部臟物,從而保持泵的性能並延長使用壽命。這個過程非常簡單,只需要打開空氣開關,讓泵在空開的情況下運行一定時間
亞馬遜廣告推出王炸級新功能,流量精準度大提升! - 天天要聞

亞馬遜廣告推出王炸級新功能,流量精準度大提升!

亞馬遜廣告功能爆更!流量精準度大大提升!這次功能更新絕對不是小修小補,而是在亞馬遜商品廣告後台悄悄上線了一個王炸級新功能! 如果你還在為廣告費高、轉化低而苦惱,那這個新功能你一定要認真了解! 它能讓你的廣告投放,更精準!更高效!更省錢!今天