「如果DeepSeek靠蒸餾為啥要怕?」「不,中國是迭代者」

2025年02月07日22:33:02 科技 1451

【文/觀察者網 楊蓉

中國企業DeepSeek近期推出的AI模型引發美國的高度關注。據香港南華早報》7日報道,美國國會「美中經濟與安全評估委員會」(USCC)6日就中國在AI領域的最新進展召開聽證會。會上有專家表示,雖然美國技術在中國AI發展中仍然發揮關鍵作用,但中國強大的創新動力和「迭代」能力可以克服這一因素。

據報道,美國喬治敦大學安全與新興技術中心研究分析員漢娜·多門(Hanna Dohmen)在其發言中稱,包括DeepSeek-R1在內的中國「最先進」AI模型,「在很大程度上」依賴於其囤積的美製晶元,「隨著這些庫存在未來幾年內耗盡,(美方)管制或導致中外在AI晶元數量和質量上的差距不斷擴大」。

儘管多門預計,這有望在中期內減緩中國AI產業發展,但她也認為,美方的管制措施會導致中國企業有更多動力「繞過管制進行創新」。「我們還必須考慮中國自身的創新能力和應對策略。」多門說,「通過限制中國獲得晶元和半導體製造設備,出口管制正在激勵中國圍繞管制進行創新。」

「如果DeepSeek靠蒸餾為啥要怕?」「不,中國是迭代者」 - 天天要聞

多門在聽證會上發言

多門提到,不少中國企業正採用「芯粒封裝」(chiplet packaging)等技術戰略,聚焦計算效率和演算法優化,以規避限制。她就此敦促美國政府制定更有效的出口管制措施,來遏制中國半導體製造能力的提升。

簡單而言,芯粒封裝就是指將多個小型晶元集成在同一個封裝內,使其在功能上相當於一個完整的大型晶元,以較低的成本和相對傳統的工藝,實現甚至超過更先進工藝所能達到的性價比。《南華早報》指出,芯粒因此在2024年被《麻省理工科技評論》評選為當年「十大突破性技術」之一。

共同出席聽證會的美國無黨派智庫「特殊競爭研究項目」(SCSP)未來技術平台高級總監、前美國國務院外交官戴維·林(David Lin,音)6日則在其證詞中警告,AI作為對中美技術競爭至關重要的「戰場領域」和「關鍵技術」之一,中國在該領域已經對美國「構成競爭」(contested)。

「到2030年,中國的目標是成為『世界主要AI創新中心』。你可以說,隨著DeepSeek-R1模型幾周前的發布,中國可能已經朝著實現其2025年目標邁出了一大步。」戴維·林在書面證詞中寫道。

「如果DeepSeek靠蒸餾為啥要怕?」「不,中國是迭代者」 - 天天要聞

戴維·林的書面證詞截圖

在提問環節,「美中經濟與安全評估委員會」委員、前特朗普政府官員克里夫·西姆斯(Cliff Sims)質疑這張圖表為何將AI分為「競爭領域」而非「美國領先」,聲稱DeepSeek僅僅是對ChatGPT的「蒸餾」,而這也意味著中國在AI發展上始終會落後美國一步。

「如果DeepSeek靠蒸餾為啥要怕?」「不,中國是迭代者」 - 天天要聞

西姆斯在聽證會上提出問題

對此,戴維·林一方面順著西姆斯的話,宣稱中國在「竊取」美國知識產權方面「有著悠久歷史」,一方面又「鼓勵」西姆斯換個角度,稱中國不應被視為「模仿者」(imitator),而應該被看作「迭代者」(iterator)。

在他看來,中國確實尚未在科學突破方面超越美國,如率先推出mRNA疫苗、ChatGPT、iPhone等,「但中國所做的是,通過其強大的製造實力,在這些創新的基礎上進行迭代,使其產品更好、更快、更便宜,而這一過程正通過DeepSeek-R1展現在我們眼前」。

戴維·林本月早些時候接受新加坡海峽時報》採訪時也表示,中美在AI發展上「已經處於並駕齊驅的狀態」。他坦言:「如果你在三個月前問我,我還會說我們穩穩領先,但形勢變得非常迅速。」

他6日在聽證會上進一步強調,DeepSeek公開表示其目標是努力實現通用人工智慧AGI),這一願景表明了中國「在AI領域的雄心壯志」。AGI是指具備像人類一樣的智能水平,能夠理解、學習、適應、推理,並在不同領域自主執行任務的AI系統,通常也被視為AI發展的終極形態。

戴維·林指出,如今這場AI技術競賽實質上是全球科技主導權之爭。「這是一個關於爭奪先發優勢的問題,第一個實現AGI的人將在全球經濟、政治及能源供應鏈方面帶來深遠的下游影響。」

「如果DeepSeek靠蒸餾為啥要怕?」「不,中國是迭代者」 - 天天要聞

戴維·林在聽證會上發言

今年1月,DeepSeek發布其最新開源模型DeepSeek-R1,用較低的成本達到了接近於美國OpenAI開發的GPT-o1的性能。這一進展破解了全球AI產業長期以來「堆算力」的路徑依賴,其影響波及資本市場。OpenAI隨後公開指控DeepSeek通過「蒸餾」技術「違規複製」其產品功能。

所謂蒸餾的理論核心,就是讓一個龐大且複雜的預訓練AI模型充當「教師」,來訓練一個較小的「學生模型」,後者從「教師模型」學習知識,以獲得類似性能,但計算成本更低。不少專家表示,蒸餾在AI業內是一種常見的做法,但若涉及直接複製閉源專有模型的輸出結構或參數,可能構成侵權。

百度全球傳播主管、前AI條線記者托尼·彭(Tony Peng,音)日前在其專欄梳理,「蒸餾」的具體操作方法有很多:如「監督微調」(SFT),即直接使用「教師模型」生成的輸出數據來訓練「學生模型」;或是「模型評分」,即讓「教師模型」充當「評委」,對模型輸出進行評分,並訓練「學生模型」更傾向於高分回答;又或是利用「教師模型」為複雜問題生成的多步驟推理鏈,讓「學生模型」模仿這種長鏈式思維(CoT)的過程。

根據DeepSeek自己發布的技術文檔,其R1模型在第一階段使用了早期模型R1-Zero的輸出作為冷啟動數據集,由人工標註員優化後進行訓練,並在第二階段繼續通過強化學習(RL)進行優化。R1-Zero模型則完全依賴RL,未使用「微調數據集」(fine-tuning datasets)。

此外,DeepSeek去年12月發布的V3模型是使用對R1的「知識蒸餾」等提升了訓練效率。技術文檔稱,DeepSeek-R1作為高級推理模型,其CoT能力被蒸餾到V3,從而提升V3的推理能力。

考慮到OpenAI尚未提供具體證據,其首席執行官奧爾特曼上周又稱「沒有計劃」起訴DeepSeek,目前輿論猜測紛紛。與此同時,也有許多聲音指出,OpenAI提出這一指控本身就頗為「虛偽和諷刺」。

「要知道,ChatGPT在訓練過程中也使用了《福布斯》或《紐約時報》的內容,這同樣違反了它們的服務條款。」康奈爾大學高級訪問講師、曾在谷歌領英等科技公司從事AI研究的盧茨·芬格(Lutz Finger)說。

矽谷內部也有人提出反思。金沙江創業投資(GSR Ventures)合伙人、長期居住在矽谷的新加坡風險投資人戴維·尹(David Yin,音)對《海峽時報》表示,許多矽谷的AI應用公司陷入思維定勢、缺乏創新,導致其盲目擴張,而不是提高效率。

「(在矽谷)當有人想給你數千億美元時,你所想的就是雇更多人、買更多算力,建造自己的『核電站』」。他說,「也許中國的參與者不擅長『從零到一』的創新,但一旦他們掌握了一項技術,就會把它優化到極致,從一做到十、一百。」

本文系觀察者網獨家稿件,未經授權,不得轉載。

科技分類資訊推薦

硬核出擊!Jeep與《侏羅紀世界》聯名款新車正式上市 - 天天要聞

硬核出擊!Jeep與《侏羅紀世界》聯名款新車正式上市

當硬核越野精神邂逅全球頂級IP,沉睡6500萬年的野性基因再度覺醒。2025年7月2日,Jeep圍繞電影《侏羅紀世界:重生》開啟跨界聯名合作,並發布兩款終極探索座駕——Jeep牧馬人侏羅紀世界探索版與Jeep角鬥士侏羅紀世界探索版。
十多年未解謎症,ChatGPT一語道破病因?微軟:「醫療超級智能」漸近 - 天天要聞

十多年未解謎症,ChatGPT一語道破病因?微軟:「醫療超級智能」漸近

《科創板日報》7月6日訊 十多年未解的疑難雜症,竟被AI一語道破病因?這個看似有些科幻的故事,來自一位網友在Reddit上分享的經歷,OpenAI總裁兼聯合創始人Greg Brockman也在今日轉發了這一事件。在這則Reddit帖子中,這位網友表示,十多年來自己一直被多種不明癥狀困擾。為此他做過脊椎核磁共振、CT 掃描、全套血液檢查(...
坐標北京,如何在體感40℃+的「桑拿天」保持優雅? - 天天要聞

坐標北京,如何在體感40℃+的「桑拿天」保持優雅?

最近咱們北京的天氣,可以說是「水深火熱」——早上出門像蒸桑拿,下午陣雨說來就來,晚上悶得睡不著覺。很多網友在後台留言「這天氣也太難熬了!」。高濕天氣連續多日達到90%以上的濕度,讓很多市民朋友高呼「難道回南天來了嗎?」今天,我們特意針對這個熱門話題,為大家詳細普及「回南天」和「桑拿天」的區別,還會教您...
徹底火了,庫存告急!訂單已排到半月後 - 天天要聞

徹底火了,庫存告急!訂單已排到半月後

近期,「充電寶召回」 事件引發廣泛關注,3C認證已成為消費者衡量充電寶品質的關鍵指標,國內部分機場也加強了對充電寶3C標識的查驗力度。央視財經記者探訪發現,線下市場和電商平台帶有3C標識的充電寶產品銷量都出現增長。