DeepSeek被美國質疑「偷竊」,論文曝突破英偉達護城河

2025年01月30日23:34:05 科技 1183

春節期間,一場關於 DeepSeek 的風波正在 AI 圈掀起波瀾。

據彭博社最新報道,微軟安全研究人員在去年秋天發現,一些可能與 DeepSeek 相關的個人通過 OpenAI 的 API 大規模提取數據。

知情人士透露,作為 OpenAI 的技術合作夥伴和最大金主,微軟在發現這一情況後立即通知了 OpenAI。

報道稱,這種行為可能違反 OpenAI 的服務條款。因為 OpenAI 的服務條款明確規定,用戶不得未經授權使用自動化或程序化方法從其服務中提取數據。

即使 DeepSeek 獲得了某種形式的 API 訪問許可權,但如果其使用方式超出了 OpenAI 授權的範圍,比如用於非法或未經授權的商業目的,也可能被視為違反服務條款。

對於相關置評請求,OpenAI 未作回應,微軟拒絕評論,而 DeepSeek 方也暫未回應。

值得一提的是,此前許多外界人士認為 通過模型蒸餾技術,DeepSeek可能在訓練過程中使用了 ChatGPT 等模型的輸出數據作為訓練材料,而這些數據中的「知識」被遷移到 DeepSeek 自己的模型中。

事實上,這種做法在 AI 領域並不罕見。

但質疑者關注的是 DeepSeek 是否在未充分披露的情況下使用了 OpenAI 模型的輸出數據。這似乎在 DeepSeek-V3 的自我認知上也有所體現。

早前就有用戶發現,當詢問模型的身份時,它會將自己誤認為是 GPT-4

DeepSeek被美國質疑「偷竊」,論文曝突破英偉達護城河 - 天天要聞

DeepSeek 團隊在最新模型 R1 的技術報告中明確表示未使用 OpenAI 模型的輸出數據,並表示通過強化學習和獨特的訓練策略實現了高性能。

例如,採用了多階段訓練方式,包括基礎模型訓練、強化學習(RL)訓練、微調等,這種多階段循環訓練方式有助於模型在不同階段吸收不同的知識和能力。

彭博社報道還指出,美國 AI 事務主管 David Sacks 近期在接受 Fox News 採訪時表示,有「確鑿證據」表明,DeepSeek 利用 OpenAI 模型的輸出數據來開發自身技術。

不過,Sacks 並未提供具體的證據。近期,美國多名官員也表示 DeepSeek有「偷竊」嫌疑,正對其影響開展國家安全調查。

DeepSeek被美國質疑「偷竊」,論文曝突破英偉達護城河 - 天天要聞

針對 David Sacks 的言論,OpenAI 的回應則比較保守。其發言人表示「我們知道,來自中國的公司以及其他一些企業,始終在嘗試『蒸餾』美國領先 AI 公司的模型。」

該發言人強調,作為 AI 領域的領先者,OpenAI 已採取相應對策來保護其知識產權,其中包括對前沿能力的嚴格篩選,決定哪些功能可以公開發布。他們認為與美國政府密切合作對於保護最先進的 AI 模型至關重要。

就在這場爭議風波持續發酵之際,外媒的目光也開始轉向 DeepSeek 更早發布的開源 V3 模型,後者則通過技術報告詳細披露了相關的深度底層優化細節。

據外媒扒出,V3 模型的開發甚至繞過了 CUDA,通過對英偉達 GPU 低級彙編語言 PTX 進行優化,從而實現了最大性能。

DeepSeek被美國質疑「偷竊」,論文曝突破英偉達護城河 - 天天要聞

PTX 是英偉達 GPU 的中間指令集架構,能夠實現寄存器分配、線程 / 線程束級別調整等細粒度優化。如果說 CUDA 是與英偉達 GPU 對話的「高級語言」,那麼 PTX 就像是一種「機器底層語言」。

想像你在玩一個遊戲機。通常情況下,我們只需要用手柄(就像 CUDA)就能玩遊戲,這很方便,但可能無法發揮遊戲機的全部實力。

而 PTX 就像是打開了遊戲機的後蓋,直接調整裡面的各種配件和線路。雖然這樣做很複雜,需要懂得很多專業知識,但是可以讓遊戲機跑得更快、性能更好。

DeepSeek被美國質疑「偷竊」,論文曝突破英偉達護城河 - 天天要聞

更通俗的解釋是,PTX 就是一種能夠讓開發者「掀開 GPU 的蓋子」,直接調教其內部運作方式的工具。這就像是改裝汽車,不是簡單地踩油門,而是直接調教發動機的每個零件,以榨取最大性能。

DeepSeek 在訓練 V3 模型時,對 H800 GPU 進行了重新配置,包括劃分出 20 個 SM 用於伺服器間通信,以及實現了流水線演算法,優化能力遠超常規 CUDA 開發水平。而倘若這一技術屬實,或將撼動英偉達構築已久的護城河

DeepSeek被美國質疑「偷竊」,論文曝突破英偉達護城河 - 天天要聞

圖片截圖來自 DeepSeek v3 技術報告

不過,PTX 雖然能極大地優化性能,但也對開發團隊提出了更高的要求。相比之下,英偉達的護城河 CUDA 憑藉其開發便捷性和快速迭代的優勢,仍然是大多數開發者的首選。

更重要的是,PTX 優化往往需要針對特定型號的硬體進行定製。

這種「量體裁衣」式的優化策略雖然效果顯著,但也大大增加了開發難度和維護成本。這也解釋了為什麼在可預見的未來,CUDA 仍將在主流開發中佔據主導地位。

但在既有規則之外尋求突破,往往就是顛覆的開始,DeepSeek 這次在海內外掀起的技術浪潮或將有望撬動整個 AI 產業鏈的既有秩序。

科技分類資訊推薦

電動牙刷哪個牌子的好用?帶你一次盤點品牌前十名產品優勢 - 天天要聞

電動牙刷哪個牌子的好用?帶你一次盤點品牌前十名產品優勢

隨著現代人口腔問題日益增多,刷牙作為口腔護理的關鍵環節顯得尤為重要。相比傳統牙刷可能存在的清潔不徹底問題,專業電動牙刷能顯著提升清潔效果,有效預防口腔疾病。然而,市面上不少產品存在過度清潔的問題,容易引發牙齒敏感、出血、牙齦不適等不良反應。
要續航有續航,要性能有性能,價格只要1989元 - 天天要聞

要續航有續航,要性能有性能,價格只要1989元

不知道大家有沒有這樣的消費習慣:預算不高,眼光還挺高。想買個性能好的手機,拍照不能拉胯,屏幕要護眼,電池要耐用,關鍵是還不能貴,最好一千多塊就能拿下,買完了還得跟朋友吹:「你看,我花這麼點錢買的手機,多值啊!」放在兩年前,你要真有這種心思,
【裝機幫扶站】第1240期:2000/3500/6000:聊幾套用戶需求較高的配置組裝方案 - 天天要聞

【裝機幫扶站】第1240期:2000/3500/6000:聊幾套用戶需求較高的配置組裝方案

【Q1】預算6000元左右,希望上一張RTX5060Ti/16GB,日常還要做一些簡單設計,希望內存至少達到32GB,請問配置如何組更加合理?盡量不超預算,謝謝!【A1】目前RTX5060Ti/16GB的市場熱度非常高,所以價格相比前期出現了小漲,就連丐中丐雙風扇散熱的產品也要賣3799~3899元的樣子,因此6000元的總預算實際非常吃緊,你只能「...
【硬體資訊】NVIDIA不再保守?物理引擎Newton開源,NVLink Fusion開放授權,合作推出Fast-dLLM 框架 - 天天要聞

【硬體資訊】NVIDIA不再保守?物理引擎Newton開源,NVLink Fusion開放授權,合作推出Fast-dLLM 框架

新聞:英偉達:計劃於 7 月開源全球最先進的物理引擎 Newton5 月 19 日消息,在今日的台北電腦展 2025 主題演講中,英偉達 CEO 黃仁勛表示,在物理世界中製造機器人「不切實際」,必須在遵循物理定律的虛擬世界中訓練它們。英偉達與 DeepMind 和 Disney Research 研究合作開發了「全球最先進的物理引擎 Newton」,計劃於.
回應 WP Engine 商標爭議事件:Linux 基金會推出 FAIR 項目 - 天天要聞

回應 WP Engine 商標爭議事件:Linux 基金會推出 FAIR 項目

IT之家 6 月 9 日消息,Linux 基金會於 6 月 6 日宣布啟動一個名為 FAIR Package Manager(FAIR)的項目,旨在打造一個去中心化的 WordPress 插件與主題生態系統,該項目意圖將控制權歸還給網站託管服務商和開發者,被業界廣泛認為是回應 WP Engine 爭議事件的一項延伸舉措。根據項目官方介紹,FAIR 套件管理器
從3199元跌至1835元,天璣9400+120w+超聲波指紋,水桶機更親民 - 天天要聞

從3199元跌至1835元,天璣9400+120w+超聲波指紋,水桶機更親民

手機行業每一年都有大變動,就不能懷著之前的想法去買手機,如果去年618你想買高性能手機,最起碼預算要有個兩千五以上,而且當時買驍龍8Gen 3手機,還要接近三千元的預算,也就是天璣9300手機會更便宜一些,當時降到兩千六七,不過那會沒有國補