「如果DeepSeek靠蒸餾為啥要怕?」「不,中國是迭代者」

2025年02月07日22:33:02 科技 1451

【文/觀察者網 楊蓉

中國企業DeepSeek近期推出的AI模型引發美國的高度關注。據香港南華早報》7日報道,美國國會「美中經濟與安全評估委員會」(USCC)6日就中國在AI領域的最新進展召開聽證會。會上有專家表示,雖然美國技術在中國AI發展中仍然發揮關鍵作用,但中國強大的創新動力和「迭代」能力可以克服這一因素。

據報道,美國喬治敦大學安全與新興技術中心研究分析員漢娜·多門(Hanna Dohmen)在其發言中稱,包括DeepSeek-R1在內的中國「最先進」AI模型,「在很大程度上」依賴於其囤積的美製晶元,「隨著這些庫存在未來幾年內耗盡,(美方)管制或導致中外在AI晶元數量和質量上的差距不斷擴大」。

儘管多門預計,這有望在中期內減緩中國AI產業發展,但她也認為,美方的管制措施會導致中國企業有更多動力「繞過管制進行創新」。「我們還必須考慮中國自身的創新能力和應對策略。」多門說,「通過限制中國獲得晶元和半導體製造設備,出口管制正在激勵中國圍繞管制進行創新。」

「如果DeepSeek靠蒸餾為啥要怕?」「不,中國是迭代者」 - 天天要聞

多門在聽證會上發言

多門提到,不少中國企業正採用「芯粒封裝」(chiplet packaging)等技術戰略,聚焦計算效率和演算法優化,以規避限制。她就此敦促美國政府制定更有效的出口管制措施,來遏制中國半導體製造能力的提升。

簡單而言,芯粒封裝就是指將多個小型晶元集成在同一個封裝內,使其在功能上相當於一個完整的大型晶元,以較低的成本和相對傳統的工藝,實現甚至超過更先進工藝所能達到的性價比。《南華早報》指出,芯粒因此在2024年被《麻省理工科技評論》評選為當年「十大突破性技術」之一。

共同出席聽證會的美國無黨派智庫「特殊競爭研究項目」(SCSP)未來技術平台高級總監、前美國國務院外交官戴維·林(David Lin,音)6日則在其證詞中警告,AI作為對中美技術競爭至關重要的「戰場領域」和「關鍵技術」之一,中國在該領域已經對美國「構成競爭」(contested)。

「到2030年,中國的目標是成為『世界主要AI創新中心』。你可以說,隨著DeepSeek-R1模型幾周前的發布,中國可能已經朝著實現其2025年目標邁出了一大步。」戴維·林在書面證詞中寫道。

「如果DeepSeek靠蒸餾為啥要怕?」「不,中國是迭代者」 - 天天要聞

戴維·林的書面證詞截圖

在提問環節,「美中經濟與安全評估委員會」委員、前特朗普政府官員克里夫·西姆斯(Cliff Sims)質疑這張圖表為何將AI分為「競爭領域」而非「美國領先」,聲稱DeepSeek僅僅是對ChatGPT的「蒸餾」,而這也意味著中國在AI發展上始終會落後美國一步。

「如果DeepSeek靠蒸餾為啥要怕?」「不,中國是迭代者」 - 天天要聞

西姆斯在聽證會上提出問題

對此,戴維·林一方面順著西姆斯的話,宣稱中國在「竊取」美國知識產權方面「有著悠久歷史」,一方面又「鼓勵」西姆斯換個角度,稱中國不應被視為「模仿者」(imitator),而應該被看作「迭代者」(iterator)。

在他看來,中國確實尚未在科學突破方面超越美國,如率先推出mRNA疫苗、ChatGPT、iPhone等,「但中國所做的是,通過其強大的製造實力,在這些創新的基礎上進行迭代,使其產品更好、更快、更便宜,而這一過程正通過DeepSeek-R1展現在我們眼前」。

戴維·林本月早些時候接受新加坡海峽時報》採訪時也表示,中美在AI發展上「已經處於並駕齊驅的狀態」。他坦言:「如果你在三個月前問我,我還會說我們穩穩領先,但形勢變得非常迅速。」

他6日在聽證會上進一步強調,DeepSeek公開表示其目標是努力實現通用人工智慧AGI),這一願景表明了中國「在AI領域的雄心壯志」。AGI是指具備像人類一樣的智能水平,能夠理解、學習、適應、推理,並在不同領域自主執行任務的AI系統,通常也被視為AI發展的終極形態。

戴維·林指出,如今這場AI技術競賽實質上是全球科技主導權之爭。「這是一個關於爭奪先發優勢的問題,第一個實現AGI的人將在全球經濟、政治及能源供應鏈方面帶來深遠的下游影響。」

「如果DeepSeek靠蒸餾為啥要怕?」「不,中國是迭代者」 - 天天要聞

戴維·林在聽證會上發言

今年1月,DeepSeek發布其最新開源模型DeepSeek-R1,用較低的成本達到了接近於美國OpenAI開發的GPT-o1的性能。這一進展破解了全球AI產業長期以來「堆算力」的路徑依賴,其影響波及資本市場。OpenAI隨後公開指控DeepSeek通過「蒸餾」技術「違規複製」其產品功能。

所謂蒸餾的理論核心,就是讓一個龐大且複雜的預訓練AI模型充當「教師」,來訓練一個較小的「學生模型」,後者從「教師模型」學習知識,以獲得類似性能,但計算成本更低。不少專家表示,蒸餾在AI業內是一種常見的做法,但若涉及直接複製閉源專有模型的輸出結構或參數,可能構成侵權。

百度全球傳播主管、前AI條線記者托尼·彭(Tony Peng,音)日前在其專欄梳理,「蒸餾」的具體操作方法有很多:如「監督微調」(SFT),即直接使用「教師模型」生成的輸出數據來訓練「學生模型」;或是「模型評分」,即讓「教師模型」充當「評委」,對模型輸出進行評分,並訓練「學生模型」更傾向於高分回答;又或是利用「教師模型」為複雜問題生成的多步驟推理鏈,讓「學生模型」模仿這種長鏈式思維(CoT)的過程。

根據DeepSeek自己發布的技術文檔,其R1模型在第一階段使用了早期模型R1-Zero的輸出作為冷啟動數據集,由人工標註員優化後進行訓練,並在第二階段繼續通過強化學習(RL)進行優化。R1-Zero模型則完全依賴RL,未使用「微調數據集」(fine-tuning datasets)。

此外,DeepSeek去年12月發布的V3模型是使用對R1的「知識蒸餾」等提升了訓練效率。技術文檔稱,DeepSeek-R1作為高級推理模型,其CoT能力被蒸餾到V3,從而提升V3的推理能力。

考慮到OpenAI尚未提供具體證據,其首席執行官奧爾特曼上周又稱「沒有計劃」起訴DeepSeek,目前輿論猜測紛紛。與此同時,也有許多聲音指出,OpenAI提出這一指控本身就頗為「虛偽和諷刺」。

「要知道,ChatGPT在訓練過程中也使用了《福布斯》或《紐約時報》的內容,這同樣違反了它們的服務條款。」康奈爾大學高級訪問講師、曾在谷歌領英等科技公司從事AI研究的盧茨·芬格(Lutz Finger)說。

矽谷內部也有人提出反思。金沙江創業投資(GSR Ventures)合伙人、長期居住在矽谷的新加坡風險投資人戴維·尹(David Yin,音)對《海峽時報》表示,許多矽谷的AI應用公司陷入思維定勢、缺乏創新,導致其盲目擴張,而不是提高效率。

「(在矽谷)當有人想給你數千億美元時,你所想的就是雇更多人、買更多算力,建造自己的『核電站』」。他說,「也許中國的參與者不擅長『從零到一』的創新,但一旦他們掌握了一項技術,就會把它優化到極致,從一做到十、一百。」

本文系觀察者網獨家稿件,未經授權,不得轉載。

科技分類資訊推薦

中國電信、中國移動、中國聯通,集體回應! - 天天要聞

中國電信、中國移動、中國聯通,集體回應!

通信行業電話營銷花樣百出,誘導升級、隱性扣費等現象依然存在。中國電信、中國移動、中國聯通16日對報道作出回應,三家表示高度重視,將開展全面自查,對於發現的問題堅決迅速整治,舉一反三,認真做好改進提升。
百度副總裁因女兒「開盒」孕婦致歉,隱私數據到底從何而來? - 天天要聞

百度副總裁因女兒「開盒」孕婦致歉,隱私數據到底從何而來?

極目新聞評論員 石平近日,多名網友發帖稱,一名微博網友自2024年以來,多次在飯圈「開盒」素人。3月上旬,其參與對一名孕婦網友的開盒網暴,同多人一起曝光對方工作單位並私信其丈夫進行辱罵,而根據該網友自己所發的微博信息,她疑似為百度副總裁謝廣軍的女兒。3月17日,百度副總裁謝廣軍發布微信朋友圈,承認涉事網友是...
小米生態鏈總經理刪除不做衛生巾微博,小米已有衛生護墊類商標,網友喊話雷軍:可以悄悄做 - 天天要聞

小米生態鏈總經理刪除不做衛生巾微博,小米已有衛生護墊類商標,網友喊話雷軍:可以悄悄做

3月18日,#小米生態鏈總經理刪除不做衛生巾微博#衝上微博熱搜。關於小米是否會生產衛生巾等產品,此前3月7日,小米生態鏈總經理陳波發文:「提前祝廣大女性朋友節日快樂,有什麼女性產品想讓我們做的嗎?(衛生巾真的做不了,大家可以許願家用電器類產品)」目前,這條博文已不可見。在近幾天的雷軍微博評論區,均有不少網...
百度副總裁女兒微博賬號自行申請關閉 - 天天要聞

百度副總裁女兒微博賬號自行申請關閉

近日,有傳聞稱,因為追星爭吵,百度副總裁謝廣軍女兒「開盒」別人,並曬出了自己父親月薪22萬的在職證明。三言發現,百度副總裁女兒的其中一個微博賬號已經自行申請關閉。此前,百度副總裁女兒一個微博賬號被禁言。
啄木鳥公布整改進度:已核實確認8655個爭議訂單,擬上線Deepseek問價 - 天天要聞

啄木鳥公布整改進度:已核實確認8655個爭議訂單,擬上線Deepseek問價

3月17日,啄木鳥家庭維修發布整改進度公示:截至3月17日18:00,已完成審核並核實確認8655個爭議訂單,針對其中的不合理收費,已完成退款、費用優化及補償。已完成88個產品、6758個服務項價格整理。3月27日前,完成「Deepseek AI 幫忙問價」功能開發,用戶可通過AI預估維修價格,並獲取小故障自檢與DIY維修指導,減少現場報...
覆蓋多個省市,廣電完成首批5G RedCap新型應急廣播終端技術試點 - 天天要聞

覆蓋多個省市,廣電完成首批5G RedCap新型應急廣播終端技術試點

IT之家 3 月 18 日消息,中國廣電昨晚宣布,其首批 5G RedCap(IT之家註:Reduced Capability,即輕量化 5G)新型應急廣播終端技術試點任務圓滿完成。據廣電介紹,此次試點工作覆蓋江蘇、上海、浙江、湖南、四川、廣州、雲南、河北、廣西等多個省市,攻克了終端適配、專網組網、應急廣播服務平台對接等多項技術難題。應急廣...
三星 AI 空調首秀,手機控制最高省電 30% - 天天要聞

三星 AI 空調首秀,手機控制最高省電 30%

IT之家 3 月 18 日消息,三星公司昨日(3 月 17 日)發布博文,報道稱於 3 月 17 日至 21 日在法蘭克福舉辦的 ISH 2025 國際建築系統展中,首次展出新一代智能家居與暖通空調(HVAC)解決方案。本次更新的亮點,在於搭載 AI 技術的 Bespoke AI WindFree 空調,用戶可以通過智能手機 App 控制,最高省電 30%