DeepSeek被美国质疑“偷窃”,论文曝突破英伟达护城河

2025年01月30日23:34:05 科技 1183

春节期间,一场关于 DeepSeek 的风波正在 AI 圈掀起波澜。

据彭博社最新报道,微软安全研究人员在去年秋天发现,一些可能与 DeepSeek 相关的个人通过 OpenAI 的 API 大规模提取数据。

知情人士透露,作为 OpenAI 的技术合作伙伴和最大金主,微软在发现这一情况后立即通知了 OpenAI。

报道称,这种行为可能违反 OpenAI 的服务条款。因为 OpenAI 的服务条款明确规定,用户不得未经授权使用自动化或程序化方法从其服务中提取数据。

即使 DeepSeek 获得了某种形式的 API 访问权限,但如果其使用方式超出了 OpenAI 授权的范围,比如用于非法或未经授权的商业目的,也可能被视为违反服务条款。

对于相关置评请求,OpenAI 未作回应,微软拒绝评论,而 DeepSeek 方也暂未回应。

值得一提的是,此前许多外界人士认为 通过模型蒸馏技术,DeepSeek可能在训练过程中使用了 ChatGPT 等模型的输出数据作为训练材料,而这些数据中的“知识”被迁移到 DeepSeek 自己的模型中。

事实上,这种做法在 AI 领域并不罕见。

但质疑者关注的是 DeepSeek 是否在未充分披露的情况下使用了 OpenAI 模型的输出数据。这似乎在 DeepSeek-V3 的自我认知上也有所体现。

早前就有用户发现,当询问模型的身份时,它会将自己误认为是 GPT-4

DeepSeek被美国质疑“偷窃”,论文曝突破英伟达护城河 - 天天要闻

DeepSeek 团队在最新模型 R1 的技术报告中明确表示未使用 OpenAI 模型的输出数据,并表示通过强化学习和独特的训练策略实现了高性能。

例如,采用了多阶段训练方式,包括基础模型训练、强化学习(RL)训练、微调等,这种多阶段循环训练方式有助于模型在不同阶段吸收不同的知识和能力。

彭博社报道还指出,美国 AI 事务主管 David Sacks 近期在接受 Fox News 采访时表示,有“确凿证据”表明,DeepSeek 利用 OpenAI 模型的输出数据来开发自身技术。

不过,Sacks 并未提供具体的证据。近期,美国多名官员也表示 DeepSeek有“偷窃”嫌疑,正对其影响开展国家安全调查。

DeepSeek被美国质疑“偷窃”,论文曝突破英伟达护城河 - 天天要闻

针对 David Sacks 的言论,OpenAI 的回应则比较保守。其发言人表示“我们知道,来自中国的公司以及其他一些企业,始终在尝试‘蒸馏’美国领先 AI 公司的模型。”

该发言人强调,作为 AI 领域的领先者,OpenAI 已采取相应对策来保护其知识产权,其中包括对前沿能力的严格筛选,决定哪些功能可以公开发布。他们认为与美国政府密切合作对于保护最先进的 AI 模型至关重要。

就在这场争议风波持续发酵之际,外媒的目光也开始转向 DeepSeek 更早发布的开源 V3 模型,后者则通过技术报告详细披露了相关的深度底层优化细节。

据外媒扒出,V3 模型的开发甚至绕过了 CUDA,通过对英伟达 GPU 低级汇编语言 PTX 进行优化,从而实现了最大性能。

DeepSeek被美国质疑“偷窃”,论文曝突破英伟达护城河 - 天天要闻

PTX 是英伟达 GPU 的中间指令集架构,能够实现寄存器分配、线程 / 线程束级别调整等细粒度优化。如果说 CUDA 是与英伟达 GPU 对话的“高级语言”,那么 PTX 就像是一种“机器底层语言”。

想象你在玩一个游戏机。通常情况下,我们只需要用手柄(就像 CUDA)就能玩游戏,这很方便,但可能无法发挥游戏机的全部实力。

而 PTX 就像是打开了游戏机的后盖,直接调整里面的各种配件和线路。虽然这样做很复杂,需要懂得很多专业知识,但是可以让游戏机跑得更快、性能更好。

DeepSeek被美国质疑“偷窃”,论文曝突破英伟达护城河 - 天天要闻

更通俗的解释是,PTX 就是一种能够让开发者“掀开 GPU 的盖子”,直接调教其内部运作方式的工具。这就像是改装汽车,不是简单地踩油门,而是直接调教发动机的每个零件,以榨取最大性能。

DeepSeek 在训练 V3 模型时,对 H800 GPU 进行了重新配置,包括划分出 20 个 SM 用于服务器间通信,以及实现了流水线算法,优化能力远超常规 CUDA 开发水平。而倘若这一技术属实,或将撼动英伟达构筑已久的护城河

DeepSeek被美国质疑“偷窃”,论文曝突破英伟达护城河 - 天天要闻

图片截图来自 DeepSeek v3 技术报告

不过,PTX 虽然能极大地优化性能,但也对开发团队提出了更高的要求。相比之下,英伟达的护城河 CUDA 凭借其开发便捷性和快速迭代的优势,仍然是大多数开发者的首选。

更重要的是,PTX 优化往往需要针对特定型号的硬件进行定制。

这种“量体裁衣”式的优化策略虽然效果显著,但也大大增加了开发难度和维护成本。这也解释了为什么在可预见的未来,CUDA 仍将在主流开发中占据主导地位。

但在既有规则之外寻求突破,往往就是颠覆的开始,DeepSeek 这次在海内外掀起的技术浪潮或将有望撬动整个 AI 产业链的既有秩序。

科技分类资讯推荐

要续航有续航,要性能有性能,价格只要1989元 - 天天要闻

要续航有续航,要性能有性能,价格只要1989元

不知道大家有没有这样的消费习惯:预算不高,眼光还挺高。想买个性能好的手机,拍照不能拉胯,屏幕要护眼,电池要耐用,关键是还不能贵,最好一千多块就能拿下,买完了还得跟朋友吹:“你看,我花这么点钱买的手机,多值啊!”放在两年前,你要真有这种心思,
【装机帮扶站】第1240期:2000/3500/6000:聊几套用户需求较高的配置组装方案 - 天天要闻

【装机帮扶站】第1240期:2000/3500/6000:聊几套用户需求较高的配置组装方案

【Q1】预算6000元左右,希望上一张RTX5060Ti/16GB,日常还要做一些简单设计,希望内存至少达到32GB,请问配置如何组更加合理?尽量不超预算,谢谢!【A1】目前RTX5060Ti/16GB的市场热度非常高,所以价格相比前期出现了小涨,就连丐中丐双风扇散热的产品也要卖3799~3899元的样子,因此6000元的总预算实际非常吃紧,你只能“...
【硬件资讯】NVIDIA不再保守?物理引擎Newton开源,NVLink Fusion开放授权,合作推出Fast-dLLM 框架 - 天天要闻

【硬件资讯】NVIDIA不再保守?物理引擎Newton开源,NVLink Fusion开放授权,合作推出Fast-dLLM 框架

新闻:英伟达:计划于 7 月开源全球最先进的物理引擎 Newton5 月 19 日消息,在今日的台北电脑展 2025 主题演讲中,英伟达 CEO 黄仁勋表示,在物理世界中制造机器人“不切实际”,必须在遵循物理定律的虚拟世界中训练它们。英伟达与 DeepMind 和 Disney Research 研究合作开发了“全球最先进的物理引擎 Newton”,计划于.
回应 WP Engine 商标争议事件:Linux 基金会推出 FAIR 项目 - 天天要闻

回应 WP Engine 商标争议事件:Linux 基金会推出 FAIR 项目

IT之家 6 月 9 日消息,Linux 基金会于 6 月 6 日宣布启动一个名为 FAIR Package Manager(FAIR)的项目,旨在打造一个去中心化的 WordPress 插件与主题生态系统,该项目意图将控制权归还给网站托管服务商和开发者,被业界广泛认为是回应 WP Engine 争议事件的一项延伸举措。根据项目官方介绍,FAIR 套件管理器
从3199元跌至1835元,天玑9400+120w+超声波指纹,水桶机更亲民 - 天天要闻

从3199元跌至1835元,天玑9400+120w+超声波指纹,水桶机更亲民

手机行业每一年都有大变动,就不能怀着之前的想法去买手机,如果去年618你想买高性能手机,最起码预算要有个两千五以上,而且当时买骁龙8Gen 3手机,还要接近三千元的预算,也就是天玑9300手机会更便宜一些,当时降到两千六七,不过那会没有国补
直播预告丨如何应用质量管理工具解决工作中的痛点和难点?(以案为鉴第二季09期) - 天天要闻

直播预告丨如何应用质量管理工具解决工作中的痛点和难点?(以案为鉴第二季09期)

第二季 第九期医院感染防控(HAI)是医疗安全的核心生命线,直接关系患者生命安危与医疗质量根基。然而,现实挑战严峻:传统防控措施常因流程衔接不畅、标准执行不一、风险识别滞后及跨部门协作壁垒而效力打折,导致手卫生依从性提升、耐药菌传播阻断、侵入性操作风险管控等关键环节成为亟待突破的痛点与难点。面对这一复杂...
中国车市有多卷?就连CR-V也能15万落地开回家了! - 天天要闻

中国车市有多卷?就连CR-V也能15万落地开回家了!

对于老百姓来说,大家在买车时最看重的就是品质,毕竟很多人的真实用车状况,就是十年八年不换车,因此哪怕在国产车崛起和新能源浪潮的冲击下,我们仍能在销量排行榜前列看到那些熟悉的合资车型,这其中就有SUV市场的常青树车型——来自东风本田的“CR-V”。