DeepSeek降本秘诀曝光:2招极致压榨推理部署,算力全留给内部AGI研究

2025年07月05日10:42:09 科技 1428

DeepSeek R1横空出世第128天,已经把整个大模型市场搅得天翻地覆!

首先,它以一己之力把推理模型的价格打下来,OpenAI六月更新的o3价格相比o1直接打了2折

DeepSeek降本秘诀曝光:2招极致压榨推理部署,算力全留给内部AGI研究 - 天天要闻

其次,第三方平台托管的DeepSeek模型使用量疯狂增长,比刚发布时涨了将近20倍成就了大批云计算厂商

DeepSeek降本秘诀曝光:2招极致压榨推理部署,算力全留给内部AGI研究 - 天天要闻

然而,DeepSeek自家的网站和API市场份额却不断下降,跟不上AI产品上半年持续增长的节奏了。

DeepSeek降本秘诀曝光:2招极致压榨推理部署,算力全留给内部AGI研究 - 天天要闻

以上数据来自SemiAnalysis发布的一篇报告,详尽解读了DeepSeek对AI模型竞赛的影响以及AI市场份额的现状。

DeepSeek降本秘诀曝光:2招极致压榨推理部署,算力全留给内部AGI研究 - 天天要闻

揭开DeepSeek的降本秘诀

DeepSeek刚发布时确实火得一塌糊涂,但四个多月过去了,情况却有点微妙。

从数据来看,DeepSeek自家网站和API的流量不升反降,市场份额也在持续下滑。

到了5月,全网DeepSeek模型产生的token中,来自DeepSeek本家的份额已经只占16%了。

DeepSeek降本秘诀曝光:2招极致压榨推理部署,算力全留给内部AGI研究 - 天天要闻

网页版聊天机器人流量也大幅下降,而同期其他主要大模型网页版流量都在飙升。

DeepSeek降本秘诀曝光:2招极致压榨推理部署,算力全留给内部AGI研究 - 天天要闻

DeepSeek V3与R1模型都经过版本更新,能力与1月相比更强了,价格又便宜,怎么用户反而跑了呢?

这种“墙内开花墙外香”的现象,背后其实大有文章。

SemiAnalysis指出,DeepSeek为了把成本压到极致,在服务质量上还是做了大量妥协

用户在DeepSeek官方平台上使用模型,经常要等上好几秒才能看到第一个字蹦出来,可以用首token延迟(First token latency)这个指标来衡量。

相比之下,其他平台虽然普遍价格更贵,但响应速度快得多,有些甚至能做到几乎零延迟。

在Parasail或Friendli等平台,只需支付3-4美元就可以获得几乎没有延迟的100万token额度。

如果想选择更大更稳定的服务商,微软Azure平台价格是DeepSeek官方的2.5倍,但延迟减少了整整25秒。

从另一个角度看,DeepSeek官方甚至不是同等延迟下价格最低的一家DeepSeek模型服务商。

DeepSeek降本秘诀曝光:2招极致压榨推理部署,算力全留给内部AGI研究 - 天天要闻

如果在这张图上用气泡大小表示上下文窗口,可以看出DeepSeek在价格与性能之间的另一个权衡。

在有限的推理计算资源下,只提供64k上下文窗口的服务,在主流模型提供商中算是最小的之一。

在需要读取整个代码库的编程场景里,64K根本不够用,用户只能选择第三方平台。

而同样价格下,Lambda和Nebius等平台能提供2.5倍以上的上下文窗口。

DeepSeek降本秘诀曝光:2招极致压榨推理部署,算力全留给内部AGI研究 - 天天要闻

DeepSeek还把很多用户的请求打包在一起处理,虽然每个token的成本降下来了,但每个用户等待的时间也增加了。

大模型下半场:提升每个token的智能

需要明确的是,这些降本策略都是DeepSeek主动做出的决定。

他们目前看上去对用户体验不怎么感兴趣,既无意从用户身上赚钱,也无意通过聊天应用或API服务向用户提供大量token,更多地是专注于实现AGI

从这些优化策略就可以看出,DeepSeek把尽可能少的算力用作推理服务给外部使用,大量的算力资源留在内部研发用途

同时配合开源策略,让其他云服务托管他们的模型,赢得影响力和培养生态,两不耽误

说到底,AI竞赛拼的还是算力资源。

在DeepSeek影响下,Claude也开始降低速度缓解算力紧张的问题,但为了营收还是在努力平衡用户体验。

Claude 4 Sonnet发布以来,输出速度已经下降了40%,但仍然比DeepSeek快不少。

另外Claude模型被设计成生成更简洁的回复,回答同样的问题,DeepSeek和Gemini可能要多花3倍的token。

DeepSeek降本秘诀曝光:2招极致压榨推理部署,算力全留给内部AGI研究 - 天天要闻

种种迹象表明,大模型供应商正在多维度地改进模型。

不仅仅是提高模型的智能上限,而是提升每个token能提供的智能

参考链接:[1]https://semianalysis.com/2025/07/03/deepseek-debrief-128-days-later/#speed-can-be-compensated-for

本文来自微信公众号“量子位”,作者:关注前沿科技,36氪经授权发布。

科技分类资讯推荐

谷歌在欧遭遇反垄断投诉,独立出版商指控“AI概览”会损害行业 - 天天要闻

谷歌在欧遭遇反垄断投诉,独立出版商指控“AI概览”会损害行业

IT之家 7 月 5 日消息,据路透社 4 日获得的一份文件显示,谷歌因其“AI 概览”功能遭到一批独立出版商向欧盟发起反垄断投诉,并被要求采取临时措施,以防对出版商造成无法弥补的损害。IT之家注:“AI 概览”是谷歌在搜索结果中提供的 AI 自动摘要,置于网页链接上方,已在全球超过 100 个国家和地区上线,并自去年 5 月起...
经历五年严峻挑战,华为智能手机销量重回中国第一 - 天天要闻

经历五年严峻挑战,华为智能手机销量重回中国第一

在经历了近五年的严峻挑战后,华为已在中国智能手机市场完成了一次非凡的回归。根据市场研究机构Counterpoint Research于7月5日发布的最新数据,2025年第二季度,华为凭借其强劲的增长势头,已超越所有竞争对手,有望重返中国市场
4399元!小米激光投影仪3发布:4K分辨率、1000流明CVIA亮度 - 天天要闻

4399元!小米激光投影仪3发布:4K分辨率、1000流明CVIA亮度

快科技7月5日消息,小米激光投影仪3悄悄登场,目前已经在电商平台上架预约,7月10日20:00开售,售价4399元,国补到手价3519.2元。新品具备4K分辨率,搭配0.47"DMD芯片,能呈现出清晰、细腻的画面,即使在120英寸巨幕上也能保证细节丰富。采用纯三色激光光源,能有效避免散斑和色边问题,在画面色彩和亮度均匀性上表现出色。...
黄力哲:分布式光伏建设带来“一增、一减、一拉动” - 天天要闻

黄力哲:分布式光伏建设带来“一增、一减、一拉动”

文/王梦瑶4日,中新社国是直通车主办“能源中国——全面加速绿色能源转型 推动协同发展”活动。华能新能源股份有限公司分布式光伏管理部负责人黄力哲结合实践在会上表示,分布式的光伏建设发展带来了“一增、一减、一拉动”。 分布式光伏发电是指在用户所在场地或附近建设运行,以用户侧自发自用为主、多余电量上网且在配电...