再次打破传统!DeepSeek发布更新,可以直接在消费级硬件上运行

3月25日,deepseek在其官网宣布了一项最新更新。

据官网公告,deepseek v3模型已完成小版本升级,目前版本号deepseek-v3-0324,用户登录官方网页、app、小程序进入对话界面后,关闭“深度思考”即可体验。api接口和使用方式保持不变。“如非复杂推理任务,建议使用新版本v3模型,即刻享受速度更加流畅、效果全面提升的对话体验。”

新版v3模型借鉴deepseek-r1模型训练过程中所使用的强化学习技术,大幅提高了在推理类任务上的表现水平,在数学、代码类相关评测集上取得了超过gpt-4.5的得分成绩;在html等代码前端任务上,新版v3模型生成的代码可用性更高,视觉效果也更加美观、富有设计感。

deepseek公告截图

同时,新版v3模型基于r1的写作水平进行了进一步优化,同时特别提升了中长篇文本创作的内容质量。新版v3模型可以在联网搜索场景下,对于报告生成类指令输出内容更为详实准确、排版更加清晰美观的结果。此外,在工具调用、角色扮演、问答闲聊等方面,新模型也得到了提升。

值得一提的是,业内的早期测试证实,该模型可以直接在消费级硬件上运行。

据报道,ai研究员awni hannun表示,新的deepseek-v3模型可以在配备m3 ultra芯片的苹果电脑上,以每秒20个token的速度运行。这打破了业界关于人工智能模型能力与本地化运行或冲突的早前共识,也意味着数据中心并不是大模型的必要搭配。

本文系观察者网独家稿件,未经授权,不得转载。