国产开源MoE指标炸裂：GPT-4级别能力，API价格仅百分之一

2024年05月07日14:21:29 科技 4386

明敏发自凹非寺

量子位 | 公众号 qbitai

最新国产开源moe大模型，刚刚亮相就火了。

deepseek-v2性能达gpt-4级别，但开源、可免费商用、api价格仅为gpt-4-turbo的百分之一。

因此一经发布，立马引发不小讨论。

从公布的性能指标来看，deepseek-v2的中文综合能力超越一众开源模型，并和gpt-4-turbo、文心4.0等闭源模型同处第一梯队。

英文综合能力也和llama3-70b同处第一梯队，并且超过了同是moe的mixtral 8x22b。

在知识、数学、推理、编程等方面也表现出不错性能。并支持128k上下文。

这些能力，普通用户都能直接免费使用。现在内测已开启，注册后立马就能体验。

api更是是骨折价：每百万tokens输入1元、输出2元（32k上下文）。价格仅为gpt-4-turbo的近百分之一。

同时在模型架构也进行创新，采用了自研的mla（multi-head latent attention）和sparse结构，可大幅减少模型计算量、推理显存。

网友感叹：deepseek总是给人带来惊喜！

具体效果如何，我们已抢先体验！

实测一下

目前v2内测版可以体验通用对话和代码助手。

在通用对话中可以测试大模型的逻辑、知识、生成、数学等能力。

比如可以要求它模仿《甄嬛传》的文风写口红种草文案。

还可以通俗解释什么是量子纠缠。

数学方面，能回答高数微积分问题，比如：

使用微积分证明自然对数的底e 的无穷级数表示。

也能规避掉一些语言逻辑陷阱。

测试显示，deepseek-v2的知识内容更新到2023年。

代码方面，内测页面显示是使用deepseek-coder-33b回答问题。

在生成较简单代码上，实测几次都没有出错。

也能针对给出的代码做出解释和分析。

不过测试中也有回答错误的情况。

如下逻辑题目，deepseek-v2在计算过程中，错误将一支蜡烛从两端同时点燃、燃烧完的时间，计算成了从一端点燃烧完的四分之一。

带来哪些升级？

据官方介绍，deepseek-v2以236b总参数、21b激活，大致达到70b~110b dense的模型能力。

和此前的deepseek 67b相比，它的性能更强，同时训练成本更低，可节省42.5%训练成本，减少93.3%的kv缓存，最大吞吐量提高到5.76倍。

官方表示这意味着deepseek-v2消耗的显存（kv cache）只有同级别dense模型的1/5~1/100，每token成本大幅降低。

专门针对h800规格做了大量通讯优化，实际部署在8卡h800机器上，输入吞吐量超过每秒10万tokens，输出超过每秒5万tokens。

在一些基础benchmark上，deepseek-v2基础模型表现如下：

deepseek-v2 采用了创新的架构。

提出mla（multi-head latent attention）架构，大幅减少计算量和推理显存。

同时自研了sparse结构，使其计算量进一步降低。

有人就表示，这些升级对于数据中心大型计算可能非常有帮助。

而且在api定价上，deepseek-v2几乎低于市面上所有明星大模型。

团队表示，deepseek-v2模型和论文也将完全开源。模型权重、技术报告都给出。

现在登录deepseek api开放平台，注册即赠送1000万输入/500万输出tokens。普通试玩则完全免费。

感兴趣的童鞋，可以来薅羊毛了~

体验地址：

https://chat.deepseek.com

api平台：

platform.deepseek.com

github：

https://github.com/deepseek-ai/deepseek-v2?tab=readme-ov-file

科技

彻底不装了！990万到手后，周鸿祎终于成了一名网红：感谢雷军 - 天天要闻

彻底不装了！990万到手后，周鸿祎终于成了一名网红：感谢雷军

要说2024年谁最红，那一定是经常穿着红衣的互联网大佬周鸿祎。打开各大短视频平台，都能看到他的身影，各大热搜事件也都有他的存在。

05月19日 1335

App能“取现”能“代还”？小心非法套现危及个人信息安全 - 天天要闻

App能“取现”能“代还”？小心非法套现危及个人信息安全

如果有这样一款App，简单操作几下就能让你的信用卡额度提现到自己的储蓄卡内，甚至动动手指就能让信用卡的还款日推迟到下个周期，听上去是不是非常有诱惑力？然而，其中却暗藏着巨大的陷阱和风险。2023年7月，湖南汨罗警方破获一起信用卡非法套现案，抓获涉案人员19人，查明套现金额约40亿元，非法获利约1.2亿元。目前，这...

05月19日 3170

Lehends机器人神钩飞爪“钩崩”BLG，GEN 2-0率先拿到赛点 - 天天要闻

Lehends机器人神钩飞爪“钩崩”BLG，GEN 2-0率先拿到赛点

北京时间5月19日，英雄联盟MSI总决赛由LPL赛区BLG战队对阵LCK赛区GEN战队。第二局GEN的Lehens机器人，给到BLG很大的视野压力，神钩一出BLG就要交闪。BLG不断的死人阵亡，让G....

05月19日 5438

珂芝 K98 机械键盘开售：Leaf-Spring Gasket 结构，279 元起 - 天天要闻

珂芝 K98 机械键盘开售：Leaf-Spring Gasket 结构，279 元起

IT之家 5 月 19 日消息，珂芝 K98 机械键盘目前已经在京东现货开售，这款键盘主打“Leaf-Spring Gasket 结构”，可选极地雪 / 沙漠绿洲 / 星岩灰色（价格取决于轴体），IT之家整理价格信息如下：彩虹轴：279 元风雨轴：299 元波塞冬轴：369 元据介绍，这款机械键盘外壳采用厚胶位注塑工艺，键盘背部拥有 3D 冰晶纹装饰，裸..

05月19日 9557

全球第一款！中国公司泄露Intel二代酷睿Ultra掌机 - 天天要闻

全球第一款！中国公司泄露Intel二代酷睿Ultra掌机

快科技5月19日消息，Intel预计会在马上到来的台北电脑展上公开下一代酷睿Ultra处理器Arrow Lake、Lunar Lake的更多具体信息，而来自我国深圳的微步公司，第一家公布了基于Lunar Lake的掌机，将在本次展会上首次亮相。这款掌机名为“GP10”，采用10.95英寸大屏，分辨率1920x1200，刷新率120Hz，支持触摸。内存容量16

05月19日 4915

海信推出 Vidda NEW S100 Pro 电视：100 英寸 192 分区，8999 元 - 天天要闻

海信推出 Vidda NEW S100 Pro 电视：100 英寸 192 分区，8999 元

IT之家 5 月 19 日消息，海信今天在京东上架一款 Vidda NEW S100 Pro 电视，这款电视主打“100 英寸 144Hz”，不过仅有 192 分区，该电视将于 5 月 21 日凌晨 0 点开售，首发价 8999 元。据介绍，这款电视配备 3840 x 2160 分辨率 144Hz 面板，拥有 192 分区，覆盖 85% DCI-P3 色域，

05月19日 2264

苹果拼了！iPhone 15官旗降至第三方渠道价：同样价格买苹果还是华为小米 - 天天要闻

苹果拼了！iPhone 15官旗降至第三方渠道价：同样价格买苹果还是华为小米

快科技5月19日消息，以价换量，似乎成了现阶段苹果的制胜法宝。临近618，尝到甜头后的苹果又开始降价了。

05月19日 1962

劲爆！小米南京科技园正式开园，小米再添一总部，雷军在线揽才 - 天天要闻

劲爆！小米南京科技园正式开园，小米再添一总部，雷军在线揽才

5月19日，小米创办人，董事长兼CEO雷军在微博发文，宣告小米南京科技园正式开园。雷军在个人微博表示：小米南京研发中心是小米最重要的几个研发基地！欢迎南京的技术大牛们加入小米南京团队！

05月19日 1896

中核集团：全国最大海上光伏电站开工建设，2025 年全容量并网 - 天天要闻

中核集团：全国最大海上光伏电站开工建设，2025 年全容量并网

IT之家 5 月 19 日消息，据中核集团消息，5 月 19 日，我国最大的海上光伏项目 —— 中核田湾 200 万千瓦滩涂光伏示范项目在江苏连云港正式开工建设。▲ 图源中核集团公众号，下同据介绍，项目预计于 2024 年 9 月首次并网，2025 年全容量并网，在运行期 25 年内年平均上网电量 22.34 亿千瓦时，能够满足中等发达国家约 23...

05月19日 2456

长治振兴小镇“研学热”持续升温 “教育＋科技”是亮点 - 天天要闻

长治振兴小镇“研学热”持续升温 “教育＋科技”是亮点

田小丽立夏之后，暑气渐显。长治振兴小镇“研学热”持续升温，研学团接踵而至。5月11日，来自长治市实验小学的学生走进振兴小镇，开展“感触科技魅力体验非遗传承”趣味研学游活动。5月18日，长治市平顺县苗庄中心校、北社中心校研学团队走进振兴小镇开展“红色教育点亮心灯劳动实践助力成长”研学游活动。……科技创新、...

05月19日 3809