春節期間,一場關於 DeepSeek 的風波正在 AI 圈掀起波瀾。
據彭博社最新報道,微軟安全研究人員在去年秋天發現,一些可能與 DeepSeek 相關的個人通過 OpenAI 的 API 大規模提取數據。
知情人士透露,作為 OpenAI 的技術合作夥伴和最大金主,微軟在發現這一情況後立即通知了 OpenAI。
報道稱,這種行為可能違反 OpenAI 的服務條款。因為 OpenAI 的服務條款明確規定,用戶不得未經授權使用自動化或程序化方法從其服務中提取數據。
即使 DeepSeek 獲得了某種形式的 API 訪問權限,但如果其使用方式超出了 OpenAI 授權的範圍,比如用於非法或未經授權的商業目的,也可能被視為違反服務條款。
對於相關置評請求,OpenAI 未作回應,微軟拒絕評論,而 DeepSeek 方也暫未回應。
值得一提的是,此前許多外界人士認為 通過模型蒸餾技術,DeepSeek可能在訓練過程中使用了 ChatGPT 等模型的輸出數據作為訓練材料,而這些數據中的「知識」被遷移到 DeepSeek 自己的模型中。
事實上,這種做法在 AI 領域並不罕見。
但質疑者關注的是 DeepSeek 是否在未充分披露的情況下使用了 OpenAI 模型的輸出數據。這似乎在 DeepSeek-V3 的自我認知上也有所體現。
早前就有用戶發現,當詢問模型的身份時,它會將自己誤認為是 GPT-4。
DeepSeek 團隊在最新模型 R1 的技術報告中明確表示未使用 OpenAI 模型的輸出數據,並表示通過強化學習和獨特的訓練策略實現了高性能。
例如,採用了多階段訓練方式,包括基礎模型訓練、強化學習(RL)訓練、微調等,這種多階段循環訓練方式有助於模型在不同階段吸收不同的知識和能力。
彭博社報道還指出,美國 AI 事務主管 David Sacks 近期在接受 Fox News 採訪時表示,有「確鑿證據」表明,DeepSeek 利用 OpenAI 模型的輸出數據來開發自身技術。
不過,Sacks 並未提供具體的證據。近期,美國多名官員也表示 DeepSeek有「偷竊」嫌疑,正對其影響開展國家安全調查。
針對 David Sacks 的言論,OpenAI 的回應則比較保守。其發言人表示「我們知道,來自中國的公司以及其他一些企業,始終在嘗試『蒸餾』美國領先 AI 公司的模型。」
該發言人強調,作為 AI 領域的領先者,OpenAI 已採取相應對策來保護其知識產權,其中包括對前沿能力的嚴格篩選,決定哪些功能可以公開發佈。他們認為與美國政府密切合作對於保護最先進的 AI 模型至關重要。
就在這場爭議風波持續發酵之際,外媒的目光也開始轉向 DeepSeek 更早發佈的開源 V3 模型,後者則通過技術報告詳細披露了相關的深度底層優化細節。
據外媒扒出,V3 模型的開發甚至繞過了 CUDA,通過對英偉達 GPU 低級彙編語言 PTX 進行優化,從而實現了最大性能。
PTX 是英偉達 GPU 的中間指令集架構,能夠實現寄存器分配、線程 / 線程束級別調整等細粒度優化。如果說 CUDA 是與英偉達 GPU 對話的「高級語言」,那麼 PTX 就像是一種「機器底層語言」。
想像你在玩一個遊戲機。通常情況下,我們只需要用手柄(就像 CUDA)就能玩遊戲,這很方便,但可能無法發揮遊戲機的全部實力。
而 PTX 就像是打開了遊戲機的後蓋,直接調整裏面的各種配件和線路。雖然這樣做很複雜,需要懂得很多專業知識,但是可以讓遊戲機跑得更快、性能更好。
更通俗的解釋是,PTX 就是一種能夠讓開發者「掀開 GPU 的蓋子」,直接調教其內部運作方式的工具。這就像是改裝汽車,不是簡單地踩油門,而是直接調教發動機的每個零件,以榨取最大性能。
DeepSeek 在訓練 V3 模型時,對 H800 GPU 進行了重新配置,包括劃分出 20 個 SM 用於服務器間通信,以及實現了流水線算法,優化能力遠超常規 CUDA 開發水平。而倘若這一技術屬實,或將撼動英偉達構築已久的護城河。
圖片截圖來自 DeepSeek v3 技術報告
不過,PTX 雖然能極大地優化性能,但也對開發團隊提出了更高的要求。相比之下,英偉達的護城河 CUDA 憑藉其開發便捷性和快速迭代的優勢,仍然是大多數開發者的首選。
更重要的是,PTX 優化往往需要針對特定型號的硬件進行定製。
這種「量體裁衣」式的優化策略雖然效果顯著,但也大大增加了開發難度和維護成本。這也解釋了為什麼在可預見的未來,CUDA 仍將在主流開發中佔據主導地位。
但在既有規則之外尋求突破,往往就是顛覆的開始,DeepSeek 這次在海內外掀起的技術浪潮或將有望撬動整個 AI 產業鏈的既有秩序。