【文/觀察者網 楊蓉】
中國企業DeepSeek近期推出的AI模型引發美國的高度關注。據香港《南華早報》7日報道,美國國會「美中經濟與安全評估委員會」(USCC)6日就中國在AI領域的最新進展召開聽證會。會上有專家表示,雖然美國技術在中國AI發展中仍然發揮關鍵作用,但中國強大的創新動力和「迭代」能力可以克服這一因素。
據報道,美國喬治敦大學安全與新興技術中心研究分析員漢娜·多門(Hanna Dohmen)在其發言中稱,包括DeepSeek-R1在內的中國「最先進」AI模型,「在很大程度上」依賴於其囤積的美製晶元,「隨著這些庫存在未來幾年內耗盡,(美方)管制或導致中外在AI晶元數量和質量上的差距不斷擴大」。
儘管多門預計,這有望在中期內減緩中國AI產業發展,但她也認為,美方的管制措施會導致中國企業有更多動力「繞過管制進行創新」。「我們還必須考慮中國自身的創新能力和應對策略。」多門說,「通過限制中國獲得晶元和半導體製造設備,出口管制正在激勵中國圍繞管制進行創新。」

多門在聽證會上發言
多門提到,不少中國企業正採用「芯粒封裝」(chiplet packaging)等技術戰略,聚焦計算效率和演算法優化,以規避限制。她就此敦促美國政府制定更有效的出口管制措施,來遏制中國半導體製造能力的提升。
簡單而言,芯粒封裝就是指將多個小型晶元集成在同一個封裝內,使其在功能上相當於一個完整的大型晶元,以較低的成本和相對傳統的工藝,實現甚至超過更先進工藝所能達到的性價比。《南華早報》指出,芯粒因此在2024年被《麻省理工科技評論》評選為當年「十大突破性技術」之一。
共同出席聽證會的美國無黨派智庫「特殊競爭研究項目」(SCSP)未來技術平台高級總監、前美國國務院外交官戴維·林(David Lin,音)6日則在其證詞中警告,AI作為對中美技術競爭至關重要的「戰場領域」和「關鍵技術」之一,中國在該領域已經對美國「構成競爭」(contested)。
「到2030年,中國的目標是成為『世界主要AI創新中心』。你可以說,隨著DeepSeek-R1模型幾周前的發布,中國可能已經朝著實現其2025年目標邁出了一大步。」戴維·林在書面證詞中寫道。

戴維·林的書面證詞截圖
在提問環節,「美中經濟與安全評估委員會」委員、前特朗普政府官員克里夫·西姆斯(Cliff Sims)質疑這張圖表為何將AI分為「競爭領域」而非「美國領先」,聲稱DeepSeek僅僅是對ChatGPT的「蒸餾」,而這也意味著中國在AI發展上始終會落後美國一步。

西姆斯在聽證會上提出問題
對此,戴維·林一方面順著西姆斯的話,宣稱中國在「竊取」美國知識產權方面「有著悠久歷史」,一方面又「鼓勵」西姆斯換個角度,稱中國不應被視為「模仿者」(imitator),而應該被看作「迭代者」(iterator)。
在他看來,中國確實尚未在科學突破方面超越美國,如率先推出mRNA疫苗、ChatGPT、iPhone等,「但中國所做的是,通過其強大的製造實力,在這些創新的基礎上進行迭代,使其產品更好、更快、更便宜,而這一過程正通過DeepSeek-R1展現在我們眼前」。
戴維·林本月早些時候接受新加坡《海峽時報》採訪時也表示,中美在AI發展上「已經處於並駕齊驅的狀態」。他坦言:「如果你在三個月前問我,我還會說我們穩穩領先,但形勢變得非常迅速。」
他6日在聽證會上進一步強調,DeepSeek公開表示其目標是努力實現通用人工智慧(AGI),這一願景表明了中國「在AI領域的雄心壯志」。AGI是指具備像人類一樣的智能水平,能夠理解、學習、適應、推理,並在不同領域自主執行任務的AI系統,通常也被視為AI發展的終極形態。
戴維·林指出,如今這場AI技術競賽實質上是全球科技主導權之爭。「這是一個關於爭奪先發優勢的問題,第一個實現AGI的人將在全球經濟、政治及能源供應鏈方面帶來深遠的下游影響。」

戴維·林在聽證會上發言
今年1月,DeepSeek發布其最新開源模型DeepSeek-R1,用較低的成本達到了接近於美國OpenAI開發的GPT-o1的性能。這一進展破解了全球AI產業長期以來「堆算力」的路徑依賴,其影響波及資本市場。OpenAI隨後公開指控DeepSeek通過「蒸餾」技術「違規複製」其產品功能。
所謂蒸餾的理論核心,就是讓一個龐大且複雜的預訓練AI模型充當「教師」,來訓練一個較小的「學生模型」,後者從「教師模型」學習知識,以獲得類似性能,但計算成本更低。不少專家表示,蒸餾在AI業內是一種常見的做法,但若涉及直接複製閉源專有模型的輸出結構或參數,可能構成侵權。
前百度全球傳播主管、前AI條線記者托尼·彭(Tony Peng,音)日前在其專欄梳理,「蒸餾」的具體操作方法有很多:如「監督微調」(SFT),即直接使用「教師模型」生成的輸出數據來訓練「學生模型」;或是「模型評分」,即讓「教師模型」充當「評委」,對模型輸出進行評分,並訓練「學生模型」更傾向於高分回答;又或是利用「教師模型」為複雜問題生成的多步驟推理鏈,讓「學生模型」模仿這種長鏈式思維(CoT)的過程。
根據DeepSeek自己發布的技術文檔,其R1模型在第一階段使用了早期模型R1-Zero的輸出作為冷啟動數據集,由人工標註員優化後進行訓練,並在第二階段繼續通過強化學習(RL)進行優化。R1-Zero模型則完全依賴RL,未使用「微調數據集」(fine-tuning datasets)。
此外,DeepSeek去年12月發布的V3模型是使用對R1的「知識蒸餾」等提升了訓練效率。技術文檔稱,DeepSeek-R1作為高級推理模型,其CoT能力被蒸餾到V3,從而提升V3的推理能力。
考慮到OpenAI尚未提供具體證據,其首席執行官奧爾特曼上周又稱「沒有計劃」起訴DeepSeek,目前輿論猜測紛紛。與此同時,也有許多聲音指出,OpenAI提出這一指控本身就頗為「虛偽和諷刺」。
「要知道,ChatGPT在訓練過程中也使用了《福布斯》或《紐約時報》的內容,這同樣違反了它們的服務條款。」康奈爾大學高級訪問講師、曾在谷歌、領英等科技公司從事AI研究的盧茨·芬格(Lutz Finger)說。
矽谷內部也有人提出反思。金沙江創業投資(GSR Ventures)合伙人、長期居住在矽谷的新加坡風險投資人戴維·尹(David Yin,音)對《海峽時報》表示,許多矽谷的AI應用公司陷入思維定勢、缺乏創新,導致其盲目擴張,而不是提高效率。
「(在矽谷)當有人想給你數千億美元時,你所想的就是雇更多人、買更多算力,建造自己的『核電站』」。他說,「也許中國的參與者不擅長『從零到一』的創新,但一旦他們掌握了一項技術,就會把它優化到極致,從一做到十、一百。」
本文系觀察者網獨家稿件,未經授權,不得轉載。