DeepSeek勸不了谷歌們 - 科技| 天天要聞

2025年02月06日09:23:03 科技 1186

本文來自微信公眾號：字母榜，作者：彥飛，編輯：王靖，題圖來自：Unsplash

過去一個月，DeepSeek以大約十分之一的訓練成本，推出與OpenAI o1性能接近的開源模型R1，「小力出奇蹟」的新範式震撼全球AI大模型行業。同時，外界對於大型科技公司動輒數百億美元的AI研發開支，也產生了越來越多的質疑。

但被「DeepSeek衝擊」嚇了一跳的科技巨頭，並沒有因此改弦更張。相反，他們正揮舞著支票簿，試圖靠瘋狂砸錢，重新奪取AI大模型的制高點。

2月5日，谷歌母公司Alphabet發布2024年第四季度財報，營收和凈利潤均實現兩位數百分比的同比增長。引人注目的是，Alphabet宣布，2025財年的資本支出將達到750億美元（約合人民幣5454億元），以繼續擴展其人工智慧戰略。

一年投入750個「小目標」研發AI，遠遠超出了華爾街599.4億美元的預期。不過，谷歌有實力如此燒錢：截至去年底，它持有現金、現金等價物及有價證券約957億美元。

稍早時候，谷歌還向AI明星創業公司Anthropic追加投資10億美元。2023年至今，谷歌向這家公司累計投資35.5億美元。

財大氣粗的谷歌投身AI燒錢競賽，其他科技巨頭也不遑多讓。

今年1月初，微軟宣布將於2025財年投資800億美元，建設AI數據中心。這筆投資創下了微軟成立以來的單筆投資最高紀錄。而在上一財年，微軟的資本支出超500億美元，大部分用於AI相關的基礎設施。

社交網路巨頭Meta在1月底宣布，公司將在今年投資600億~650億美元，並大幅擴張AI團隊，以期實現Meta AI服務10億人、Llama 4成為行業領先大模型的目標。Meta創始人扎克伯格稱，今年將是「AI決定性的一年」。

OpenAI則拉上軟銀、甲骨文、微軟、ARM、英偉達以及中東人工智慧基金（MGX）等產業和投資巨頭，預計投資5000億美元，聯手成立「星際之門」，這些資金將被用於數據中心等AI基礎設施的建設與運營。

相比之下，國內科技巨頭面向AI大模型的砸錢規模小了一個數量級，但也動輒數百億元，且增長很快。

根據財報等公開信息，2024年前三季度，百度、阿里、騰訊的總資本開支約為人民幣867億元。金融數據服務商Visible Alpha預計，到2027年，BAT的資本支出將達到1767億元，年複合增長率超26%。考慮到BAT的重視程度，這些資本開支將有很大一部分流向AI大模型。

不難看出，科技巨頭髮展AI大模型，砸錢仍然是基本武器之一。儘管DeepSeek證明了「小力出奇蹟」的可行性，但巨頭們出於多種原因，仍然沿著「大力出奇蹟」的路線前行。

這並非僅僅是大公司的慣性使然。OpenAI剛剛發布的o3-mini，已經在物理推理等多項指標上反超R1，而更強大的o3標準版也已經箭在弦上。這也再次證明，「尺度定律」仍然是AI大模型的基本規則之一，而「小力出奇蹟」並非置之四海而皆準。

尚未找到「金主爸爸」的DeepSeek，在算力、數據、資金和資源方面比不上巨頭，正面臨被後來者強行超車的危險。不過，R1的成功，也證明了「小力出奇蹟」的可行性。在DeepSeek震動全球AI圈後，巨頭青睞的「砸錢」與「小力出奇蹟」的路線之爭仍在繼續，遠未分出勝負。

一

面對快速崛起的DeepSeek，美國科技巨頭表面上對其技術、產品和方法論讚嘆不已，但在戰略層面上，並沒有對其「小力出奇蹟」的策略亦步亦趨。

恰恰相反，在DeepSeek席捲全球AI大模型領域後，巨頭們的砸錢邁向了新高度。

以OpenAI為例，奧特曼起初對於DeepSeek有所懷疑，稱「並不新穎，我們早已具備這一水平的模型」，且「被嚴重誇大了」。OpenAI甚至在1月底表示，DeepSeek涉嫌使用OpenAI專有模型訓練自己的模型，違反了OpenAI的服務條款。

但在短短几天后，奧特曼宣布沒有計划起訴DeepSeek，同時稱讚「DeepSeek是一個令人印象深刻的模型」。在推出最新的o3-mini模型後，奧特曼甚至表示，在開源方面，OpenAI一直站在「錯誤的一邊」。

DeepSeek大紅大紫，逼得奧特曼前倨後恭、低頭認錯，此情此景讓不少人感到驚訝和振奮。但事實上，OpenAI無論是產品還是戰略，都沒有被DeepSeek這隻「黑天鵝」所打亂。

1月底，OpenAI推出o3-mini，並首次向免費用戶開放推理模型。測試表明，o3-mini相比上一代o1模型進步極大，多項基準測試表現優異；特別是面對高難度的物理模擬項目——如球體碰撞等，展現出對於R1及其他模型的碾壓實力。

幾天後，OpenAI又以o3模型為基礎發布了Deep Research功能，號稱可以在幾十分鐘內完成人類專家數小時的工作。在涵蓋超3000道問題的綜合測試「人類最後一場考試」中，Deep Research實現了26.6%的正確率，遠超DeepSeek R1的9.4%。

o3-mini採用了許多與R1相同的技術，比如強化學習（RL）、稀疏化MoE、大量監督微調（SFT）等，最終成果也堪稱驚艷。然而，Open並沒有在研發範式上向DeepSeek靠攏，而是繼續沿著「氪金」的路線狂飆。

就在拿出o3-mini對陣DeepSeek R1的同時，OpenAI高調宣布了5000億美元的「星際之門」計劃。該計劃將在全美國打造20座超算中心；首期將投資1000億美元，在得州建設10座數據中心。

儘管奧特曼的「一生之敵」馬斯克火速趕來嘲諷，信誓旦旦地說「他們沒有錢」，但星際之門的進展速度頗為驚人。計劃公開幾天後，奧特曼就曬出了「1號站點」的照片，稱之為「宏偉而美麗的建築」。

儘管星際之門得到了軟銀和甲骨文的鼎力支持，且去年營收已經高達37億美元，OpenAI仍在繼續儲備資金。

據報道，OpenAI正尋求以3400億美元估值融資400億美元，軟銀有望領投。而在短短三個月前，OpenAI剛剛以1570億美元的估值，融到了66億美元。

奧特曼彷彿患上「資金短缺恐懼症」，一邊瘋狂融資，一邊大手筆花錢。與之正面PK的其他科技巨頭，砸錢同樣毫不手軟。

今年，谷歌、微軟、Meta等均計劃投入數百億美元發展AI，力度之大遠超華爾街預期。以Meta為例，扎克伯格計劃斥資至少600億美元，建設一座擁有130萬塊GPU的AI數據中心。

作為對比，據科技諮詢公司Omdia測算，位元組去年買了23萬塊GPU，且為性能較弱的英偉達特供版。即便如此，這一數字也遠遠超出了DeepSeek目前持有的晶元規模。

二

除了海外科技巨頭，國內互聯網公司也在AI大模型領域投入巨資。DeepSeek的「小力出奇蹟」，並沒有改寫這一局面。

一度在AI大模型領域落後的位元組，近兩年灑下重金。浙商證券在一份報告中稱，2024年位元組資本開支約800億元，接近BAT的總和。

另有報道稱，位元組2025年資本開支將超1500億，大部分用於AI。位元組方面隨後否認了這一說法。

此外，位元組持續「掃貨」國內AI領域的頂級人才。據「財經天下」報道，位元組某些AI方向的業務團隊在招募知名院校的博士應屆生時，年薪可達兩三百萬元，遠超其他大廠的100萬元左右。此外，張一鳴還親自從阿里等對手那裡挖人。

除了研發費用和人才成本，過去一兩年，位元組在B端和C端同時為AI燒錢，力圖爭奪更多企業和個人用戶。

在B端，豆包大模型自去年5月發布之後不斷降價，堪稱國內AI大模型圈子的「價格屠夫」。據統計，豆包文字大模型比行業便宜99.3%，去年12月發布的視覺理解模型比行業便宜85%。

同時，在C端，豆包也在廣泛投流拉新。據AppGrowing統計，去年4~5月，豆包投放金額預計為1500萬~1750萬元。6月上旬，豆包啟動新一輪投放活動，投放金額高達1.24億元。

在猛砸資金後，豆包的用戶量猛增，成為國內用戶最多的大模型應用。

阿里同樣在AI大模型領域持續投入大筆資金。今年總台春晚，阿里雲成為雲計算AI獨家合作夥伴。僅2024年上半年，阿里在AI基礎設施上的資本支出就達到230億元。此外，阿里花費超百億元，投資AI創業公司「六小虎」。

騰訊方面，過去六年其研發總投入超2850億元，其中很大一部分投向了AI。而在AI「六小虎」中，騰訊投資了其中五家。

僅就花錢力度而言，新BAT比不過谷歌、Meta、OpenAI，但依然是國內AI大模型圈獨一檔的存在。相比之下，一直沒有融資的DeepSeek，仍然靠母公司幻方量化輸血；但國內量化投資近年來處於行業谷底，DeepSeek能夠得到的資金支持恐怕不會很多。

不過，面對DeepSeek的強勢崛起，新BAT在繼續大手筆投錢的同時，也試圖伸出橄欖枝、構建「雙保險」。

1月底、2月初，國內主要雲服務廠商均宣布接入DeepSeek大模型。阿里雲宣布支持雲上一鍵部署V3和R1，百度智能雲、騰訊雲、位元組旗下火山引擎等也先後宣布了類似功能。

眾所周知，DeepSeek採用了最「慷慨」的開源協議，並不限制第三方對於自家開源模型的商用。阿里雲等廠商第一時間接入DeepSeek大模型，能夠借著後者的潑天流量，為自己爭取一波關注度和新用戶。

另一方面，向DeepSeek伸出橄欖枝，也側面表明了大廠的心態：即便DeepSeek與自家AI業務存在競爭，也不妨先為我所用，並從中獲得技術、產品等方面的啟發。這些主動示好的舉動，也為雙方未來更大規模的合作留下了想像空間。

三

DeepSeek以「小力出奇蹟」揚名天下，但目前為止，這一頗為性感的新範式並未得到國內外大廠的全面認可與接納。砸錢、砸資源的「大力出奇蹟」，依然是大廠參與AI大模型競爭的主要打法。

與此同時，隨著競爭對手以新一代模型反擊，疊加自身規模擴大導致的種種問題，DeepSeek正面臨被全面反超的危險。

從產品上看，越來越多的用戶發覺，DeepSeek的大模型幻覺頻繁出現。無論是談論從A到B的最佳路線，還是解析某一首歌曲，或分析某一專業話題，DeepSeek都存在較為嚴重的「一本正經地胡說八道」問題。

大模型的幻覺問題一直廣泛存在，也是整個AI圈子始終未能克服的難題。DeepSeek在這方面並沒有展現比其他模型更出色的性能，這折射出僅靠大模型工程層面的創新，並不足以攻克更基礎的AI難題。

另一方面，短時間內瘋狂湧入的全球用戶，也讓DeepSeek有些力不從心。

據統計，DeepSeek自上線各大應用商店以來，短期內獲得1600萬次下載，登頂140個應用市場，最高日活躍用戶突破2200萬。由於用戶太多，DeepSeek的深度思考和聯網搜索功能一度暫時停止服務。

這也表明，「小力出奇蹟」或許可以大幅節約模型訓練的成本，但在模型投入使用後，必要的基礎設施成本仍然無法壓減。

從商業角度來看，AI大模型註定是一門規模越大、能力越強、成本越高的生意。巨頭們堅守「尺度定律」，其根基——算力、演算法和數據三角模型依然穩固。

在DeepSeek崛起的過程中，一個被不少人忽視的問題是，R1的推理性能與o1不相上下，但在許多基準測試中不如o1。而箭在弦上的o3「滿血版」，綜合性能遠超o1。和同期其他對手相比，比如谷歌的Gemini 2.0 Flash，R1也並非全面領先，而是與對手各擅勝場。

在專業人士眼中，R1的真正價值是，通過多種技術創新——比如強化學習、GRPO演算法框架、DeepSeek MOE等，再加上優秀的工程思想，以較低成本在部分指標接近或超越了行業最強大模型。DeepSeek的「小力出奇蹟」固然驚艷，但從來不是性能最強的大模型。

OpenAI剛發布的o3-mini，在許多測試中已經反超R1，也讓國外巨頭繼續狂砸錢有了更堅實的證明。這表明，除了優秀的人才、出色的演算法外，強大的算力、豐富的數據，也是構建更強大模型，乃至通往AGI的必經之路。

DeepSeek「小力出奇蹟」證明了AI大模型的另一條發展路徑，卻並非唯一的路徑。手握重金的科技巨頭，依然是AI大模型的主要參與者，同時也是DeepSeek繼續上攻的強大對手。

AI大模型遠未分出勝負，DeepSeek及其擁躉不能「半場開香檳」。而高性價比路線與「大力出奇蹟」路線之爭，也仍將持續下去，並在互相借鑒和融合中，推動AI大模型邁向下一個發展階段。

參考資料：

APPSO，《萬字揭秘DeepSeek：頂尖AI人才年薪千萬，訓練成本被低估》

亂彈山，《我確實低估了DeepSeek所引發的大面積「AI幻覺」》

億歐網，《特朗普孫正義組局，預砸5000億美金建「星際之門」》

IT之家，《Meta宣布將打造擁有 130 萬顆 GPU 的 AI 數據中心》

新智元，《o3-mini物理推理粉碎DeepSeek R1，OpenAI王者歸來！全網最全實測》

本文來自微信公眾號：字母榜，作者：彥飛，編輯：王靖

本內容為作者獨立觀點，不代表虎嗅立場。未經允許不得轉載，授權事宜請聯繫 [email protected]

正在改變與想要改變世界的人，都在虎嗅APP

科技分類資訊推薦

科技分類視頻推薦

雨姐今天做小雞燉大鵝，老香了#東北#生活...

雨姐今天在家烤全羊，老香了#生活#東北...

今天跟大傢伙一起，簡簡單單聚個餐#東北#生活#美食...

老爸，你看這是什麼！#直播帶貨 #瘋狂小楊哥 #瘋狂大楊哥 #紅綠燈的黃 #搞笑...

雨姐今天去集市買點蔬菜，囤秋菜#東北#生活...

中國家宴，歡迎大家來雨姐家蹭一頓「簡簡單單」的雞黍飯#東北#生活...

東北物價這麼低？四人午飯消費51元，飯桌上大成子因啥拒絕當姐夫...

中秋團圓杉杉來遲，記錄我的農村生活 #東北#生活...

小楊哥出包她慘背鍋！直播曝真相：大公司還要我扛？@cosmosviral...

盤點那些有趣的東北姑娘，性格豪爽的東北女孩，個個都是虎娘們...