「如果DeepSeek靠蒸餾為啥要怕?」「不,中國是迭代者」

2025年02月07日22:33:02 科技 1451

【文/觀察者網 楊蓉

中國企業DeepSeek近期推出的AI模型引發美國的高度關注。據香港南華早報》7日報道,美國國會「美中經濟與安全評估委員會」(USCC)6日就中國在AI領域的最新進展召開聽證會。會上有專家表示,雖然美國技術在中國AI發展中仍然發揮關鍵作用,但中國強大的創新動力和「迭代」能力可以克服這一因素。

據報道,美國喬治敦大學安全與新興技術中心研究分析員漢娜·多門(Hanna Dohmen)在其發言中稱,包括DeepSeek-R1在內的中國「最先進」AI模型,「在很大程度上」依賴於其囤積的美製晶元,「隨著這些庫存在未來幾年內耗盡,(美方)管制或導致中外在AI晶元數量和質量上的差距不斷擴大」。

儘管多門預計,這有望在中期內減緩中國AI產業發展,但她也認為,美方的管制措施會導致中國企業有更多動力「繞過管制進行創新」。「我們還必須考慮中國自身的創新能力和應對策略。」多門說,「通過限制中國獲得晶元和半導體製造設備,出口管制正在激勵中國圍繞管制進行創新。」

「如果DeepSeek靠蒸餾為啥要怕?」「不,中國是迭代者」 - 天天要聞

多門在聽證會上發言

多門提到,不少中國企業正採用「芯粒封裝」(chiplet packaging)等技術戰略,聚焦計算效率和演算法優化,以規避限制。她就此敦促美國政府制定更有效的出口管制措施,來遏制中國半導體製造能力的提升。

簡單而言,芯粒封裝就是指將多個小型晶元集成在同一個封裝內,使其在功能上相當於一個完整的大型晶元,以較低的成本和相對傳統的工藝,實現甚至超過更先進工藝所能達到的性價比。《南華早報》指出,芯粒因此在2024年被《麻省理工科技評論》評選為當年「十大突破性技術」之一。

共同出席聽證會的美國無黨派智庫「特殊競爭研究項目」(SCSP)未來技術平台高級總監、前美國國務院外交官戴維·林(David Lin,音)6日則在其證詞中警告,AI作為對中美技術競爭至關重要的「戰場領域」和「關鍵技術」之一,中國在該領域已經對美國「構成競爭」(contested)。

「到2030年,中國的目標是成為『世界主要AI創新中心』。你可以說,隨著DeepSeek-R1模型幾周前的發布,中國可能已經朝著實現其2025年目標邁出了一大步。」戴維·林在書面證詞中寫道。

「如果DeepSeek靠蒸餾為啥要怕?」「不,中國是迭代者」 - 天天要聞

戴維·林的書面證詞截圖

在提問環節,「美中經濟與安全評估委員會」委員、前特朗普政府官員克里夫·西姆斯(Cliff Sims)質疑這張圖表為何將AI分為「競爭領域」而非「美國領先」,聲稱DeepSeek僅僅是對ChatGPT的「蒸餾」,而這也意味著中國在AI發展上始終會落後美國一步。

「如果DeepSeek靠蒸餾為啥要怕?」「不,中國是迭代者」 - 天天要聞

西姆斯在聽證會上提出問題

對此,戴維·林一方面順著西姆斯的話,宣稱中國在「竊取」美國知識產權方面「有著悠久歷史」,一方面又「鼓勵」西姆斯換個角度,稱中國不應被視為「模仿者」(imitator),而應該被看作「迭代者」(iterator)。

在他看來,中國確實尚未在科學突破方面超越美國,如率先推出mRNA疫苗、ChatGPT、iPhone等,「但中國所做的是,通過其強大的製造實力,在這些創新的基礎上進行迭代,使其產品更好、更快、更便宜,而這一過程正通過DeepSeek-R1展現在我們眼前」。

戴維·林本月早些時候接受新加坡海峽時報》採訪時也表示,中美在AI發展上「已經處於並駕齊驅的狀態」。他坦言:「如果你在三個月前問我,我還會說我們穩穩領先,但形勢變得非常迅速。」

他6日在聽證會上進一步強調,DeepSeek公開表示其目標是努力實現通用人工智慧AGI),這一願景表明了中國「在AI領域的雄心壯志」。AGI是指具備像人類一樣的智能水平,能夠理解、學習、適應、推理,並在不同領域自主執行任務的AI系統,通常也被視為AI發展的終極形態。

戴維·林指出,如今這場AI技術競賽實質上是全球科技主導權之爭。「這是一個關於爭奪先發優勢的問題,第一個實現AGI的人將在全球經濟、政治及能源供應鏈方面帶來深遠的下游影響。」

「如果DeepSeek靠蒸餾為啥要怕?」「不,中國是迭代者」 - 天天要聞

戴維·林在聽證會上發言

今年1月,DeepSeek發布其最新開源模型DeepSeek-R1,用較低的成本達到了接近於美國OpenAI開發的GPT-o1的性能。這一進展破解了全球AI產業長期以來「堆算力」的路徑依賴,其影響波及資本市場。OpenAI隨後公開指控DeepSeek通過「蒸餾」技術「違規複製」其產品功能。

所謂蒸餾的理論核心,就是讓一個龐大且複雜的預訓練AI模型充當「教師」,來訓練一個較小的「學生模型」,後者從「教師模型」學習知識,以獲得類似性能,但計算成本更低。不少專家表示,蒸餾在AI業內是一種常見的做法,但若涉及直接複製閉源專有模型的輸出結構或參數,可能構成侵權。

百度全球傳播主管、前AI條線記者托尼·彭(Tony Peng,音)日前在其專欄梳理,「蒸餾」的具體操作方法有很多:如「監督微調」(SFT),即直接使用「教師模型」生成的輸出數據來訓練「學生模型」;或是「模型評分」,即讓「教師模型」充當「評委」,對模型輸出進行評分,並訓練「學生模型」更傾向於高分回答;又或是利用「教師模型」為複雜問題生成的多步驟推理鏈,讓「學生模型」模仿這種長鏈式思維(CoT)的過程。

根據DeepSeek自己發布的技術文檔,其R1模型在第一階段使用了早期模型R1-Zero的輸出作為冷啟動數據集,由人工標註員優化後進行訓練,並在第二階段繼續通過強化學習(RL)進行優化。R1-Zero模型則完全依賴RL,未使用「微調數據集」(fine-tuning datasets)。

此外,DeepSeek去年12月發布的V3模型是使用對R1的「知識蒸餾」等提升了訓練效率。技術文檔稱,DeepSeek-R1作為高級推理模型,其CoT能力被蒸餾到V3,從而提升V3的推理能力。

考慮到OpenAI尚未提供具體證據,其首席執行官奧爾特曼上周又稱「沒有計劃」起訴DeepSeek,目前輿論猜測紛紛。與此同時,也有許多聲音指出,OpenAI提出這一指控本身就頗為「虛偽和諷刺」。

「要知道,ChatGPT在訓練過程中也使用了《福布斯》或《紐約時報》的內容,這同樣違反了它們的服務條款。」康奈爾大學高級訪問講師、曾在谷歌領英等科技公司從事AI研究的盧茨·芬格(Lutz Finger)說。

矽谷內部也有人提出反思。金沙江創業投資(GSR Ventures)合伙人、長期居住在矽谷的新加坡風險投資人戴維·尹(David Yin,音)對《海峽時報》表示,許多矽谷的AI應用公司陷入思維定勢、缺乏創新,導致其盲目擴張,而不是提高效率。

「(在矽谷)當有人想給你數千億美元時,你所想的就是雇更多人、買更多算力,建造自己的『核電站』」。他說,「也許中國的參與者不擅長『從零到一』的創新,但一旦他們掌握了一項技術,就會把它優化到極致,從一做到十、一百。」

本文系觀察者網獨家稿件,未經授權,不得轉載。

科技分類資訊推薦

iPhone一鍵降溫?蘋果這隱藏模式有點過分啊 - 天天要聞

iPhone一鍵降溫?蘋果這隱藏模式有點過分啊

為了解決發熱這亘古難題,手機廠商絞盡腦汁,往手機里塞散熱膜、均熱板、填充硅脂,甚至還用上了主動風扇。 但到了夏天三四十度的室外,該發熱還是發熱,該燙手還是燙手。 國產安卓如此。 ....
三星Galaxy S26Ultra不裝了,性能太炸裂了! - 天天要聞

三星Galaxy S26Ultra不裝了,性能太炸裂了!

三星Galaxy S26 Ultra即將亮相,帶來多方面升級。·該機型將採用6.9英寸QHD+LTPO AMOLED顯示屏,支持120Hz自適應刷新率和3000尼特峰值亮度,確保在各種光照條件下都能提供清晰的視覺體驗。
中集洋山集裝箱第三季度訂單飽滿 開拓氫能集成裝備求新|公司調研 - 天天要聞

中集洋山集裝箱第三季度訂單飽滿 開拓氫能集成裝備求新|公司調研

財聯社7月5日訊(記者 胡皓瓊)中美關稅緩和之下,外貿企業對美出貨恢復,帶動中集洋山集裝箱製造訂單增長。集裝箱製造廠在提升自動化水平的同時,為提高自身抗風險能力,還正布局新賽道。財聯社記者近日走訪中集集團(000039.SZ)旗下中集洋山,眼見一片片鋼板,經歷衝壓、焊接組裝、打砂等一道道工序,逐漸成形。產線上布...
數據寶一體機實機首秀2025生態文明貴陽國際論壇 - 天天要聞

數據寶一體機實機首秀2025生態文明貴陽國際論壇

7月5日至6日,2025年生態文明貴陽國際論壇召開,數據寶攜其AI技術領先成果重磅亮相論壇人工智慧展區,並以「企業私域業務模型一體機」實機首秀,現場演繹數據資產與AI深度賦能綠色發展的創新融合實踐。數據寶「企業私域業務模型一體機」。
登上C909樣機,聽聽中國商飛工程總師怎麼說?《明青講習所》又上新了 - 天天要聞

登上C909樣機,聽聽中國商飛工程總師怎麼說?《明青講習所》又上新了

名師金課《明青講習所》今又上新,這期節目《「科學家精神」的迴響》聚焦於「科學家精神的時代傳承」,定於7月5日(周六)19:30 在上海教育電視台首播。陳明青老師帶領華東師範大學第一附屬中學、上海市魯迅中學、上海南湖職業技術學院的學生們,踏上沉浸式學習之旅,走進錢學森圖書館、中國商飛上海飛機設計研究院、上海科...