「如果DeepSeek靠蒸餾為啥要怕？」「不，中國是迭代者」

2025年02月07日22:33:02 科技 1451

【文/觀察者網楊蓉】

中國企業DeepSeek近期推出的AI模型引發美國的高度關注。據香港《南華早報》7日報道，美國國會「美中經濟與安全評估委員會」（USCC）6日就中國在AI領域的最新進展召開聽證會。會上有專家表示，雖然美國技術在中國AI發展中仍然發揮關鍵作用，但中國強大的創新動力和「迭代」能力可以克服這一因素。

據報道，美國喬治敦大學安全與新興技術中心研究分析員漢娜·多門（Hanna Dohmen）在其發言中稱，包括DeepSeek-R1在內的中國「最先進」AI模型，「在很大程度上」依賴於其囤積的美製晶元，「隨著這些庫存在未來幾年內耗盡，（美方）管制或導致中外在AI晶元數量和質量上的差距不斷擴大」。

儘管多門預計，這有望在中期內減緩中國AI產業發展，但她也認為，美方的管制措施會導致中國企業有更多動力「繞過管制進行創新」。「我們還必須考慮中國自身的創新能力和應對策略。」多門說，「通過限制中國獲得晶元和半導體製造設備，出口管制正在激勵中國圍繞管制進行創新。」

多門在聽證會上發言

多門提到，不少中國企業正採用「芯粒封裝」（chiplet packaging）等技術戰略，聚焦計算效率和演算法優化，以規避限制。她就此敦促美國政府制定更有效的出口管制措施，來遏制中國半導體製造能力的提升。

簡單而言，芯粒封裝就是指將多個小型晶元集成在同一個封裝內，使其在功能上相當於一個完整的大型晶元，以較低的成本和相對傳統的工藝，實現甚至超過更先進工藝所能達到的性價比。《南華早報》指出，芯粒因此在2024年被《麻省理工科技評論》評選為當年「十大突破性技術」之一。

共同出席聽證會的美國無黨派智庫「特殊競爭研究項目」（SCSP）未來技術平台高級總監、前美國國務院外交官戴維·林（David Lin，音）6日則在其證詞中警告，AI作為對中美技術競爭至關重要的「戰場領域」和「關鍵技術」之一，中國在該領域已經對美國「構成競爭」（contested）。

「到2030年，中國的目標是成為『世界主要AI創新中心』。你可以說，隨著DeepSeek-R1模型幾周前的發布，中國可能已經朝著實現其2025年目標邁出了一大步。」戴維·林在書面證詞中寫道。

戴維·林的書面證詞截圖

在提問環節，「美中經濟與安全評估委員會」委員、前特朗普政府官員克里夫·西姆斯（Cliff Sims）質疑這張圖表為何將AI分為「競爭領域」而非「美國領先」，聲稱DeepSeek僅僅是對ChatGPT的「蒸餾」，而這也意味著中國在AI發展上始終會落後美國一步。

西姆斯在聽證會上提出問題

對此，戴維·林一方面順著西姆斯的話，宣稱中國在「竊取」美國知識產權方面「有著悠久歷史」，一方面又「鼓勵」西姆斯換個角度，稱中國不應被視為「模仿者」（imitator），而應該被看作「迭代者」（iterator）。

在他看來，中國確實尚未在科學突破方面超越美國，如率先推出mRNA疫苗、ChatGPT、iPhone等，「但中國所做的是，通過其強大的製造實力，在這些創新的基礎上進行迭代，使其產品更好、更快、更便宜，而這一過程正通過DeepSeek-R1展現在我們眼前」。

戴維·林本月早些時候接受新加坡《海峽時報》採訪時也表示，中美在AI發展上「已經處於並駕齊驅的狀態」。他坦言：「如果你在三個月前問我，我還會說我們穩穩領先，但形勢變得非常迅速。」

他6日在聽證會上進一步強調，DeepSeek公開表示其目標是努力實現通用人工智慧（AGI），這一願景表明了中國「在AI領域的雄心壯志」。AGI是指具備像人類一樣的智能水平，能夠理解、學習、適應、推理，並在不同領域自主執行任務的AI系統，通常也被視為AI發展的終極形態。

戴維·林指出，如今這場AI技術競賽實質上是全球科技主導權之爭。「這是一個關於爭奪先發優勢的問題，第一個實現AGI的人將在全球經濟、政治及能源供應鏈方面帶來深遠的下游影響。」

戴維·林在聽證會上發言

今年1月，DeepSeek發布其最新開源模型DeepSeek-R1，用較低的成本達到了接近於美國OpenAI開發的GPT-o1的性能。這一進展破解了全球AI產業長期以來「堆算力」的路徑依賴，其影響波及資本市場。OpenAI隨後公開指控DeepSeek通過「蒸餾」技術「違規複製」其產品功能。

所謂蒸餾的理論核心，就是讓一個龐大且複雜的預訓練AI模型充當「教師」，來訓練一個較小的「學生模型」，後者從「教師模型」學習知識，以獲得類似性能，但計算成本更低。不少專家表示，蒸餾在AI業內是一種常見的做法，但若涉及直接複製閉源專有模型的輸出結構或參數，可能構成侵權。

前百度全球傳播主管、前AI條線記者托尼·彭（Tony Peng，音）日前在其專欄梳理，「蒸餾」的具體操作方法有很多：如「監督微調」（SFT），即直接使用「教師模型」生成的輸出數據來訓練「學生模型」；或是「模型評分」，即讓「教師模型」充當「評委」，對模型輸出進行評分，並訓練「學生模型」更傾向於高分回答；又或是利用「教師模型」為複雜問題生成的多步驟推理鏈，讓「學生模型」模仿這種長鏈式思維（CoT）的過程。

根據DeepSeek自己發布的技術文檔，其R1模型在第一階段使用了早期模型R1-Zero的輸出作為冷啟動數據集，由人工標註員優化後進行訓練，並在第二階段繼續通過強化學習（RL）進行優化。R1-Zero模型則完全依賴RL，未使用「微調數據集」（fine-tuning datasets）。

此外，DeepSeek去年12月發布的V3模型是使用對R1的「知識蒸餾」等提升了訓練效率。技術文檔稱，DeepSeek-R1作為高級推理模型，其CoT能力被蒸餾到V3，從而提升V3的推理能力。

考慮到OpenAI尚未提供具體證據，其首席執行官奧爾特曼上周又稱「沒有計劃」起訴DeepSeek，目前輿論猜測紛紛。與此同時，也有許多聲音指出，OpenAI提出這一指控本身就頗為「虛偽和諷刺」。

「要知道，ChatGPT在訓練過程中也使用了《福布斯》或《紐約時報》的內容，這同樣違反了它們的服務條款。」康奈爾大學高級訪問講師、曾在谷歌、領英等科技公司從事AI研究的盧茨·芬格（Lutz Finger）說。

矽谷內部也有人提出反思。金沙江創業投資（GSR Ventures）合伙人、長期居住在矽谷的新加坡風險投資人戴維·尹（David Yin，音）對《海峽時報》表示，許多矽谷的AI應用公司陷入思維定勢、缺乏創新，導致其盲目擴張，而不是提高效率。

「（在矽谷）當有人想給你數千億美元時，你所想的就是雇更多人、買更多算力，建造自己的『核電站』」。他說，「也許中國的參與者不擅長『從零到一』的創新，但一旦他們掌握了一項技術，就會把它優化到極致，從一做到十、一百。」

本文系觀察者網獨家稿件，未經授權，不得轉載。