当开源ai模型正成为技术巨头必争之地,openai却出人意料地按下暂停键。openai首席执行官sam altman宣布其备受期待的开源模型将延期至“今年夏天晚些时候”,而非原定的6月。这场技术突袭恰逢中国deepseek等开源强敌加速抢滩,延期背后是技术豪赌还是市场狙击?
6月11日周三,altman在x平台发文称:
我们将对开源权重模型投入更多时间,也就是说,预计会在今年夏天晚些时候推出,而不是六月。我们的研究团队做了一些出乎意料且相当令人惊叹的事情,我们认为这将非常非常值得等待,但需要稍长时间。
据此前规划,该模型将具备与gpt-4o相当的复杂推理能力,性能目标直指超越当前顶尖开源推理模型——包括中国深度求索(deepseek)的r1模型。
当前ai市场竞争已经显著加剧。周二,法国ai实验室mistral推出了其首个ai推理模型系列magistral;4月,中国ai实验室通义千问(qwen)发布了一系列混合ai推理模型,能够在深入推理和传统快速响应间切换。
据techcrunch此前报道,openai领导层曾讨论为开源ai模型增加复杂功能,包括开源模型添加连接云端大模型的接口功能,以处理超复杂查询。然而,这些功能是否会被纳入最终版本尚不清楚。
更深层压力来自企业战略转型。altman曾公开承认,openai过去在开源方面一直站在“历史错误的一边”。此次开源模型被视为修复开发者关系的核心举措,若无法在性能上匹敌deepseek r1等头部开源产品,openai将面临巨大声誉风险。
网友也猜测,openai此举可能是为了狙击deepseek r2。“如果现在匆忙发一个,等deepseek r2出来,打不过就很尴尬了。”
deepseek r2指日可待
deepseek r2是深度求索公司研发的新一代多模态大语言模型,作为其前代产品r1的迭代版本,r2在技术架构、功能特性、资源效率等方面实现了显著升级。
摩根士丹利6月初一篇研报预测,deepseek r2的ai调用成本大降87%,推理能力升级,图像、语音、视频全能处理。
华尔街见闻此前文章提及,deepseek创始人梁文锋曾表示:“中国也要逐步成为创新贡献者,而不是一直搭便车。” 他将探索通用人工智能的本质作为核心使命。
根据《中国企业家》的报道,deepseek创始人梁文锋带领的ai团队一直保持着与国际巨头同步的产品迭代节奏——2024年9月推出v2.5版本,12月发布v3基础架构,次年3月升级至v3-0324版本,形成每季度重大更新的开发范式。
如此稳健而高效的产品迭代节奏,传言已久的deepseek r2或指日可待。
本文来自华尔街见闻,欢迎下载app查看更多