DeepSeek被美國質疑「偷竊」,論文曝突破英偉達護城河

2025年01月30日23:34:05 科技 1183

春節期間,一場關於 DeepSeek 的風波正在 AI 圈掀起波瀾。

據彭博社最新報道,微軟安全研究人員在去年秋天發現,一些可能與 DeepSeek 相關的個人通過 OpenAI 的 API 大規模提取數據。

知情人士透露,作為 OpenAI 的技術合作夥伴和最大金主,微軟在發現這一情況後立即通知了 OpenAI。

報道稱,這種行為可能違反 OpenAI 的服務條款。因為 OpenAI 的服務條款明確規定,用戶不得未經授權使用自動化或程序化方法從其服務中提取數據。

即使 DeepSeek 獲得了某種形式的 API 訪問權限,但如果其使用方式超出了 OpenAI 授權的範圍,比如用於非法或未經授權的商業目的,也可能被視為違反服務條款。

對於相關置評請求,OpenAI 未作回應,微軟拒絕評論,而 DeepSeek 方也暫未回應。

值得一提的是,此前許多外界人士認為 通過模型蒸餾技術,DeepSeek可能在訓練過程中使用了 ChatGPT 等模型的輸出數據作為訓練材料,而這些數據中的「知識」被遷移到 DeepSeek 自己的模型中。

事實上,這種做法在 AI 領域並不罕見。

但質疑者關注的是 DeepSeek 是否在未充分披露的情況下使用了 OpenAI 模型的輸出數據。這似乎在 DeepSeek-V3 的自我認知上也有所體現。

早前就有用戶發現,當詢問模型的身份時,它會將自己誤認為是 GPT-4

DeepSeek被美國質疑「偷竊」,論文曝突破英偉達護城河 - 天天要聞

DeepSeek 團隊在最新模型 R1 的技術報告中明確表示未使用 OpenAI 模型的輸出數據,並表示通過強化學習和獨特的訓練策略實現了高性能。

例如,採用了多階段訓練方式,包括基礎模型訓練、強化學習(RL)訓練、微調等,這種多階段循環訓練方式有助於模型在不同階段吸收不同的知識和能力。

彭博社報道還指出,美國 AI 事務主管 David Sacks 近期在接受 Fox News 採訪時表示,有「確鑿證據」表明,DeepSeek 利用 OpenAI 模型的輸出數據來開發自身技術。

不過,Sacks 並未提供具體的證據。近期,美國多名官員也表示 DeepSeek有「偷竊」嫌疑,正對其影響開展國家安全調查。

DeepSeek被美國質疑「偷竊」,論文曝突破英偉達護城河 - 天天要聞

針對 David Sacks 的言論,OpenAI 的回應則比較保守。其發言人表示「我們知道,來自中國的公司以及其他一些企業,始終在嘗試『蒸餾』美國領先 AI 公司的模型。」

該發言人強調,作為 AI 領域的領先者,OpenAI 已採取相應對策來保護其知識產權,其中包括對前沿能力的嚴格篩選,決定哪些功能可以公開發布。他們認為與美國政府密切合作對於保護最先進的 AI 模型至關重要。

就在這場爭議風波持續發酵之際,外媒的目光也開始轉向 DeepSeek 更早發布的開源 V3 模型,後者則通過技術報告詳細披露了相關的深度底層優化細節。

據外媒扒出,V3 模型的開發甚至繞過了 CUDA,通過對英偉達 GPU 低級彙編語言 PTX 進行優化,從而實現了最大性能。

DeepSeek被美國質疑「偷竊」,論文曝突破英偉達護城河 - 天天要聞

PTX 是英偉達 GPU 的中間指令集架構,能夠實現寄存器分配、線程 / 線程束級別調整等細粒度優化。如果說 CUDA 是與英偉達 GPU 對話的「高級語言」,那麼 PTX 就像是一種「機器底層語言」。

想象你在玩一個遊戲機。通常情況下,我們只需要用手柄(就像 CUDA)就能玩遊戲,這很方便,但可能無法發揮遊戲機的全部實力。

而 PTX 就像是打開了遊戲機的後蓋,直接調整裡面的各種配件和線路。雖然這樣做很複雜,需要懂得很多專業知識,但是可以讓遊戲機跑得更快、性能更好。

DeepSeek被美國質疑「偷竊」,論文曝突破英偉達護城河 - 天天要聞

更通俗的解釋是,PTX 就是一種能夠讓開發者「掀開 GPU 的蓋子」,直接調教其內部運作方式的工具。這就像是改裝汽車,不是簡單地踩油門,而是直接調教發動機的每個零件,以榨取最大性能。

DeepSeek 在訓練 V3 模型時,對 H800 GPU 進行了重新配置,包括劃分出 20 個 SM 用於服務器間通信,以及實現了流水線算法,優化能力遠超常規 CUDA 開發水平。而倘若這一技術屬實,或將撼動英偉達構築已久的護城河

DeepSeek被美國質疑「偷竊」,論文曝突破英偉達護城河 - 天天要聞

圖片截圖來自 DeepSeek v3 技術報告

不過,PTX 雖然能極大地優化性能,但也對開發團隊提出了更高的要求。相比之下,英偉達的護城河 CUDA 憑藉其開發便捷性和快速迭代的優勢,仍然是大多數開發者的首選。

更重要的是,PTX 優化往往需要針對特定型號的硬件進行定製。

這種「量體裁衣」式的優化策略雖然效果顯著,但也大大增加了開發難度和維護成本。這也解釋了為什麼在可預見的未來,CUDA 仍將在主流開發中佔據主導地位。

但在既有規則之外尋求突破,往往就是顛覆的開始,DeepSeek 這次在海內外掀起的技術浪潮或將有望撬動整個 AI 產業鏈的既有秩序。

科技分類資訊推薦

長安與東風重組新進展:朱華榮稱不會改變長安既定戰略 - 天天要聞

長安與東風重組新進展:朱華榮稱不會改變長安既定戰略

2月9日,長安汽車和東風集團股份(00489.HK)同步發布了控股股東“正在與其他國資央企集團籌劃重組事項”的信息。長安汽車的控股股東是兵裝集團,而東風集團股份的控股股東是東風公司。隨即,長安汽車和東風集團這兩家汽車央企將合併重組,成為業內關注的焦點。
公安部出手了!年齡限制放寬10年、送考下鄉,2025年考駕照不難了 - 天天要聞

公安部出手了!年齡限制放寬10年、送考下鄉,2025年考駕照不難了

電動車加強管理以後,要求機動車類型的車輛需要持證上路,但是老年人考駕照卻受阻,一方面有年齡的限制,另一方面偏遠山區考駕照不方便,所以在2025年公安部出手了,年齡限制放寬10年,同時推出送考下鄉服務,還進一步的降低考駕照的費用,2025年起考摩托車駕照不難了。
從“星靈安全守護體系”到昊鉑HL,看懂廣汽科技日 - 天天要聞

從“星靈安全守護體系”到昊鉑HL,看懂廣汽科技日

發布會以技術切入,並全程圍繞安全展開。廣汽集團董事長、總經理馮興亞率先登場,宣布2025年四季度將正式上市支持L3級智能駕駛的車型,他同時強調面向自動駕駛時代對智能駕駛技術、整車安全架構以及突發風險處理能力的要求更高。如何才能滿足更高的要求?馮興亞提到了“廣汽
關稅大棒下,最受傷的車企出現了 - 天天要聞

關稅大棒下,最受傷的車企出現了

特朗普的關稅大棒剛揮出,尚未嚇退“外敵”,卻先刺痛了自己。近日,擁有瑪莎拉蒂、Jeep等14個品牌的全球第四大車企斯泰蘭蒂斯突然宣布裁撤900名美國工人,關閉加拿大和墨西哥兩家工廠,北美生產線陷入癱瘓。幾乎同一時間,捷豹路虎宣布暫停對美出口一個月,奧迪更是直接