DeepSeek 的含金量,还在上升

2025年01月27日23:40:20 娱乐 8747

就在刚刚,老狐发现本土大模型 deepseek 又“崩了”

DeepSeek 的含金量,还在上升 - 天天要闻

在昨天(1月26日)就已经崩过一次了,不是我说,deepseek 真得升级一下服务器架构咯,不过这已进一步佐证了 deepseek 到底有多火。

在这几天,一款名为 deepseek 的 app 突然跃升至苹果美国区免费 app 下载排行榜榜首,力压风头无两的 chatgpt,在通用大模型领域,美区可是 chatgpt 的主场,deepseek 凭什么能反客为主?

可能很多朋友不清楚 deepseek 到底是啥,我可以用一句话来形容它:ai 届的 pdd

DeepSeek 的含金量,还在上升 - 天天要闻

有多实惠呢?

openai ceo sam altman 透露过,gpt-4 的训练成本大约 7800 万美元,尚未完成训练的 gpt-5 大模型,为时约半年的一轮训练就消耗了大约 5 亿美元、

而 deepseek-v3 大模型训练成本仅为 558 万美元,成本低,其 api 服务价格也延续了过往亲民的打法。

deepseek 官网的价格表显示,缓存命中输入价格仅为 0.1 元/百万 tokens,缓冲未命中输入价格为 1 元/百万 tokens,输出价格则为 2 元/百万 tokens,在诸多 ai 大模型中属于最低的一档。(注明:1token 约等于 1.5 个汉字或 3 个英文字母)

DeepSeek 的含金量,还在上升 - 天天要闻

1 月 20 日正式发布的 deepseek-r1 模型,更是夸张。性能上比肩 o1 的推理能力,并同步开源模型权重,任何人均可自行下载与部署,提供论文详细说明训练步骤与窍门,甚至提供了可以运行在手机上的 mini 模型。

更何况,deepseek-r1 可是支持实时联网、目前唯一支持实时联网的超级 ai,获取到的信息都是最新的。

怪不得 openai ceo sam altman 连忙剧透 o3-mini 使用额度,不过你这chatgpt plus 会员每天可查询 100 次,还是不如免费的 deepseek 来得震撼啊。

免费、好用、更快的 ai 大模型,谁不想要呢?也难怪会在海外市场搅动风云。

DeepSeek 的含金量,还在上升 - 天天要闻技术有哪些创新

有别于“复制黏贴”,deepseek 从模型结构入手

deepseek 来自国内大模型公司深度求索,有别于绝大多数同行复制 llama 架构的做法,deepseek 创始人梁文锋此前曾多次强调,deepseek 致力于开辟差异化技术路线,而非复制 openai 的模式,deepseek 必须想出更有效的方法来训练其模型。

根据 deepseek 公布的 deepseek-r1 信息显示,其在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。

根据 deepseek 对外披露的信息可以发现,其在 mla 多头潜在注意力机制和自研的 deepseekmoe 结构方面取得了重大进展,这两种技术设计通过减少训练计算资源,使 deepseek 模型更具成本效益,也提升了训练效率。

DeepSeek 的含金量,还在上升 - 天天要闻

来自加州伯克利大学在读博士 jiayi pan 的研究团队更是成功地以极低的成本(低于 30 美元)复现了 deepseek r1-zero 的关键技术——“顿悟时刻”。

“未来或许不需要超大规模的gpu集群了。”在 deepseek 的高性价比模型发布后,openai 创始成员 andrej karpathy 表示。

可以这么说,deepseek 的成功可以被视为对美国算力出口限制的直接回应,这种外部压力反而刺激了中国的创新:更少的算力需求,更高效的计算效率。

DeepSeek 的含金量,还在上升 - 天天要闻硅谷ai霸权和神话的破灭

除了自身的优秀保证站稳脚跟,真正让 deepseek 爆火的推力,可能还是来自同行的 meta。

前不久,美国匿名职场社区 teamblind 上,有 meta 员工直言,deepseek 最近的一系列动作让 meta 的生成式 ai 团队陷入了恐慌,前者低成本的训练工作,让后者难以解释自己超高预算的合理性。

meta 的工程师们正在争分夺秒地分析 deepseek 的技术,试图从中复制任何可能的技术。

DeepSeek 的含金量,还在上升 - 天天要闻

图灵奖得主、meta 首席 ai 科学家 yann lecun 出来表示,

“中国在 ai 方面正在超越美国”

DeepSeek 的含金量,还在上升 - 天天要闻

“开源模型正在超越专有模型”

DeepSeek 的含金量,还在上升 - 天天要闻

微软首席执行官萨蒂亚·纳德拉在瑞士达沃斯世界经济论坛上表示,看到 deepseek 的新模型令人印象非常深刻,他们切实有效地开发出了一款开源模型,在推理计算方面表现出色,且超级计算效率极高,必须非常、非常认真地对待中国的这些进展。

demis hassabis 则表示,“我们需要考虑如何保持西方前沿模型的领先地位,我认为西方仍然领先,但可以肯定的是,中国具有极强的工程和规模化能力。”

DeepSeek 的含金量,还在上升 - 天天要闻

国际主流媒体也给予了 deepseek 不小的关注度。

英媒《金融时报》刊文《深度求索等中国初创企业正在挑战全球ai巨头》,对于深度求索给予高度评价。文章称,该公司推出的 v3 模型震惊了国际科技界,其性能可与资金更雄厚的 openai 等美国竞争对手相媲美;r1 模型给人留下了深刻印象,是其进军ai推理领域的尝试。

DeepSeek 的含金量,还在上升 - 天天要闻中国ai已经超越美国?

不过,现在就高呼中国 ai 已经超越美国还是有点早了。

就个人使用体验来看,虽然 deepseek 在逻辑推理方面表现出色,但其功能缺乏是最大的问题,无法创作图片、无法生成 ppt,对于很多需要用到这类功能的人群来说还是比较难受的

此外,它也不提供智能体可选,功能相对较少。

DeepSeek 的含金量,还在上升 - 天天要闻

刘知远也公开表示,需要警惕舆论从极度悲观转向极度乐观,觉得我们已经全面超越、遥遥领先了,事实上远远没有,用一句话来形容的话:“在别人已经探索出的路上跟随快跑还是相对容易的,接下来如何在迷雾中开拓新路,才是更大的挑战。”

要想要一直“火下去”,除了自身的实力,还有对自己品牌的认知,deepseek 最核心的优势还是得益于算法上的创新。

deepseek 的 ai 届拼多多称号不是白给的,但卷价格的同时,deepseek 未来将要面临的压力和挑战不会少,未来的资金压力、后续的技术迭代,deepseek 还能取得怎样的成就,让我们拭目以待!

娱乐分类资讯推荐

不管你多节俭,这6类东西该扔就扔吧 - 天天要闻

不管你多节俭,这6类东西该扔就扔吧

过期药品与保健品:家中的小药箱往往是容易被忽视的地方,一些过期的药品和保健品不仅失去了原有的效用,还可能产生有害物质,误服将对健康造成严重威胁。大扫除时,务必检查并清理这些过期物品,确保家庭用药安全。
李晓旭:在《织造府》塑造从未有过的贾宝玉 - 天天要闻

李晓旭:在《织造府》塑造从未有过的贾宝玉

“上海观众以包容态度看待新编剧目,《织造府》演出现场的热烈感觉扑面而来。”4月11日、12日,南京市越剧团团长,梅花奖、白玉兰奖得主李晓旭携新剧《织造府》登陆上海东方艺术中心,她分饰曹雪芹、贾宝玉两角,带领一群年轻演员展示不一样的《红楼梦》故事。《织造府》作为毕派小生,李晓旭对上海充满感情,“我是毕春芳...
(文化中国行)传统曲艺混搭相声“圈粉”年轻人 - 天天要闻

(文化中国行)传统曲艺混搭相声“圈粉”年轻人

中新社合肥4月13日电 题:传统曲艺混搭相声“圈粉”年轻人 作者 傅天骋 黄梅戏遇上相声曲艺,历史人物“穿越”舞台,安徽方言化身“爆梗”——在安徽合肥一家相声馆里,每天都上演着传统曲艺与青春潮流的奇妙碰撞。剧场创始人薛培森透露,自推出“新派皖韵相声”以来,“95后”至“00后”观众占比突破80%,百余座位周周爆满...