美國創新,中國迭代。這句格言——或其不那麼客氣的版本「中國模仿」——主導著關於全球第一和第二大經濟體相對優勢的諸多討論。按照這種說法,美國站在技術前沿,開創引領世界經濟走向的突破性產品和服務。中國則吸收這些理念並加以發展,推出更廉價的版本。
在人工智慧領域,這一陳詞濫調多年來似乎確有其事,中國企業難以與資金雄厚、人才濟濟的美國科技巨頭匹敵。但今年一月,一家中國初創企業打破了這一固有認知。
總部位於杭州的深度求索(deepseek)——嚴格來說甚至不算科技公司,而是對沖基金高瓴資本(high-flyer)的衍生企業——發布了「推理」大語言模型r1(llm),其性能與幾個月前openai發布的o1旗鼓相當。r1不僅看似橫空出世,還兼具驚人創新性與極低成本。據深度求索透露,其前代模型v3的最終「訓練周期」僅耗資600萬美元——用前特斯拉ai科學家安德烈·卡帕西的話說,與美國部分競品動輒數千萬乃至上億美元的投入相比,「簡直是預算笑話」。
這則新聞的影響巨大:隨著r1飆升至最受歡迎下載榜單首位,大型科技公司的投資者陷入恐慌,導致英偉達和微軟等科技股市值蒸發超過1萬億美元。openai首席執行官薩姆·奧爾特曼等業界領袖公開表達了憂慮,甚至考慮轉向開源模式——正如深度求索所做的那樣,公開其模型並允許修改,從而降低使用成本。
「包括我在內的許多人,都低估了中國在開發這些尖端突破技術方面的能力,」喬治華盛頓大學政治學助理教授、《chinai》通訊作者丁傑弗里表示。
美國的不安與中國的高興形成鮮明對比。深度求索創始人梁文鋒在2月民營企業座談會上獲得了一個令人艷羨的席位——與阿里巴巴創始人馬雲和華為創始人任正非等傑出人物同席。比亞迪等電動汽車製造商和美的等家電企業正爭相將深度求索的模型整合到自家產品中。
在中國悲觀情緒瀰漫之際,這無疑是一劑樂觀強心針。"深度求索(deepseek)單槍匹馬就能以政府永遠無法企及的方式重振經濟,"諮詢公司奧爾布賴特石橋集團科技政策負責人保羅·特里奧羅表示。
但deepseek只是中國蓬勃發展的ai領域中眾多參與者之一,許多美國ceo對此視而不見。阿里巴巴和位元組跳動(tiktok母公司)等科技巨頭髮布的ai模型,在推理基準測試中已超越西方產品。而新一代規模較小的「ai小龍」正通過移動應用、ai代理和機器人,將中國高性價比且高效的ai技術應用於現實世界。
與此同時,投資者已迅速迴流至中國科技股。追蹤香港上市科技企業的恒生科技指數年內漲幅達35%,領漲個股包括阿里巴巴、開發文生視頻ai模型kling的快手,以及助力華為製造ai晶元的中國「國家隊」晶元製造商中芯國際。
儘管投資者對深度求索的橫空出世感到意外,但長期觀察中國經濟的人士對此並不驚訝。人工智慧可能成為又一個中國憑藉「快速跟隨」策略實現技術對等甚至領先的行業。中國太陽能電池板和風力渦輪機已在推動全球能源轉型;中國電動汽車助力該國成為全球最大汽車出口國——甚至非中國品牌的電動車也依賴中國電池驅動。在無人機、機器人及生物技術等領域,中國企業已躋身全球領導者行列。
一些西方ceo對這些成就嗤之以鼻,將其歸因於政府補貼、知識產權盜竊、走私和違反出口管制。但事實證明,使中國能在各種技術競賽中保持競爭力的因素既持久又強大:龐大的製造業基礎;熱衷於模仿外國競爭對手;人才儲備深厚;以及一個能夠充當支持者和啦啦隊的政府。
經濟學家、《中國新玩法》作者金刻羽解釋說,中國的創新者可能更專註於「量身定製的問題解決」,而非美國那種「突破性、系統性思維」。但這種有針對性的「足夠好」的創新方式,使中國能夠大規模生產價格親民的技術產品,即使像深度求索這樣的企業已接近技術前沿。當西方商業領袖還在為如何承擔ai進步的巨額成本發愁時,中國可能很快就能向世界其他國家出售它們夢寐以求的產品。
快速反彈
就在兩年前,中國似乎註定要在人工智慧領域遠遠落後。2020年,北京發起了一場曠日持久的運動,旨在遏制中國科技行業的發展,部分政治領導人認為該行業既過於強大又不夠負責。隨著北京圍繞數據隱私實施更嚴格的法規,一度穩定的中國科技企業ipo浪潮戛然而止。
2022年openai推出的chatgpt讓中美在ai領域的差距更為明顯。隨後發布的中國本土產品llms普遍表現不及chatgpt——即便是在中文環境下運行。與此同時,美國的出口管制阻止了中國企業獲取英偉達的ai晶元,而這些晶元對訓練和運行llms至關重要。
丁指出,2024年秋是敘事轉變的時刻。"你開始看到差距在縮小,"他說,尤其是在開源領域,"中國企業開始優化更小規模的模型,這些模型可以更高效地訓練。"
與此同時,中國的ai行業孵化了一波又一波的新創企業。最初是「小龍」——如商湯科技和曠視科技這類機器學習與計算機視覺公司,它們吸引了全球目光。當焦點轉向生成式ai時,關注度轉移到了「ai四虎」——百川智能、月之暗面、minimax和智譜ai。如今,它們的光芒被最新一批「龍」所掩蓋:六家總部位於杭州的初創企業,其中包括深度求索。
阿里巴巴的故鄉杭州是中國人工智慧創新的溫床。「它遠離北京的優勢避免了各種官僚程序;靠近上海的好處是可以接觸到國際資本和人才;由於阿里巴巴、網易等企業的存在,這裡還有極其強大的人才庫,」人工智慧諮詢公司proem創始人邵嘉玲解釋道。阿里巴巴本身一直是開源創作者的推動者:在開源ai社區huggingface上按性能排名的前10名llms,都是在阿里巴巴的通義千問模型上訓練的。
在這座城市備受矚目的新興企業中,有在央視春晚舞台上展示跳舞機器人、吸引數億觀眾目光的宇樹科技;打造了2024年最暢銷電子遊戲之一《黑神話:悟空》的遊戲科學工作室;以及專註於3d渲染的"空間智能"公司manycore。
中國人工智慧行業為何能如此迅速地迎頭趕上?一個原因在於中國市場規模龐大。邵嶺指出,當擁有超過10億用戶的微信平台運營商騰訊向用戶提供deepseek的llm服務時,deepseek的用戶基數實現了重大飛躍,這家初創公司隨即成為中國人工智慧領域的巨頭之一。
政府在決定如何利用這一規模方面發揮著關鍵作用。通過政策、法規和補貼,全國各地的官員創建了一個「國家協調」的創新體系,私營部門往往會圍繞該體系的重點展開行動。政府扮演著「啦啦隊長」的角色,特里奧洛表示:「當梁文鋒與政府官員會面時,那是一個信號。」確實,那次二月的高層會議釋放了中國deepseek的熱潮:首先,中國電信公司接受並推廣其llms,隨後科技和消費類公司紛紛效仿,最後地方官員也跟進。
諷刺的是,美國對半導體的出口管制可能反而加速了中國的創新。「資金從來不是我們的問題;先進晶元的禁運才是問題所在,」梁去年對中國媒體表示。多年來,由於製造商可以從海外購買更優質的晶元,中國晶元行業一直難以起步。但經濟學家金指出,美國的貿易限制「動員了整個國家去追求尖端技術」。
電信巨頭華為目前處於中國先進晶元供應鏈的前沿。其昇騰ai晶元——儘管性能仍不及英偉達——正被深度求索等初創公司用於"推理",即在ai模型訓練完成後在實際場景中運行。
最後一個要素是人才:中國的大學正源源不斷地培養出充滿熱情的工程師,供人工智慧初創企業挖掘。儘管深度求索的部分工程師接受過西方教育,但特里奧羅指出,「梁文鋒走出去招募了這些頂尖人才——他們是沒有西方經歷的年輕人,並非來自麻省理工或斯坦福。」他補充說,首席執行官們「對中國二流、三流甚至四流大學培養出的人才質量感到震驚。在美國的大學裡,你找不到這樣的人才,更不用說如此龐大的數量。」
一些觀察人士還注意到中國"90後"創業者態度的重大轉變。邵亦波指出,老一輩科技創業者認為"模仿無妨,但要做得更好",而"如今(創業者)談論開源是一種哲學選擇。中國可以創新,而不僅僅是模仿。"
需要克服的障礙
儘管深度求索的成功帶來了巨大衝擊,但這並不必然預示著中國將在人工智慧領域取得如太陽能電池板或電動汽車那樣的主導地位。
除其他障礙外,中國科技初創企業缺乏資本化機會,而這能讓美國的同行獲得充裕資金和明確的退出策略。2020年代初的科技行業整頓使本已疲軟的中國風險投資領域幾乎陷入停滯。中國本土的風險投資公司寥寥無幾,隨著與美國的地緣政治緊張局勢加劇,外國風險投資者也紛紛撤資。(值得注意的是,深度求索並未獲得風投支持,而是依靠其對沖基金母公司的雄厚財力。)
在3月舉行的"兩會"上,北京公布了今年的經濟工作重點,表示將啟動"國家風險投資引導基金",動員1萬億元人民幣(1380億美元)投向"硬科技"——這表明承認私營部門需要國家的推動。
但正如深度求索的成就所示,中國ai初創企業或許無需巨額資金就能具備全球競爭力。中國官方目前支持成本相對較低的開源ai模型開發,以此推動國產技術的廣泛應用。阿里巴巴等企業則認為,開源模型將吸引更多客戶使用其生態系統。
在日益保護主義的特朗普政府領導下,新興的ai模型可能無法在美國獲得廣泛採用。但它們可以在世界其他地區贏得客戶。deepseek對效率和開放性的關注,可能比昂貴且專有的openai風格技術更適合新興市場——這些市場富有創新精神,但缺乏計算能力和資本。
中國企業已經通過廉價但可靠的太陽能板、電動汽車和手機,在海外市場展現了巨大的滲透力。如果像深度求索和阿里巴巴這樣的公司能繼續降低對最昂貴計算能力的需求,所謂的"全球南方"很可能會放棄世界上最好的人工智慧,轉而選擇它們負擔得起的最佳人工智慧。