一文读懂 | 关于DeepSeek公司及其大模型

2025年01月27日19:33:24 科技 1008

来源:环球市场播报

一文读懂 | 关于DeepSeek公司及其大模型 - 天天要闻

作为一家成立仅一年多的人工智能(AI)初创公司,DeepSeek凭借突破性的AI模型在硅谷收获了惊叹和错愕:该模型的性能不亚于全球最强的那些聊天机器人,而成本看起来只有它们的一个零头。

DeepSeek的异军突起,或对AI向前发展将需要越来越多电力和能源的普遍看法构成挑战。

随着DeepSeek创新引发的热度越来越高,投资者开始消化它对其美国竞争对手及它们的硬件供应商的影响,全球科技股在1月末大跌。

DeepSeek究竟是什么?

DeepSeek是一家于2023年成立的中国初创企业,创始人是AI驱动量化对冲基金幻方量化的掌门人梁文锋。该公司开发开源AI模型,这意味着广大的开发者社区可以检查和改进软件。其移动应用程序(app)于1月初发布,然后迅速登顶美国iPhone下载榜。

该app与OpenAI旗下ChatGPT等其他聊天机器人的区别是,它会在对提示做出回应之前阐明其推理过程。该公司声称,其R1版本的性能与OpenAI的最新版本相当,并且允许用户利用模型输出、通过模型蒸馏等方式训练其他模型。

DeepSeek R1与OpenAI或Meta AI比起来怎么样?

尽管该公司没有详细说明培训和开发DeepSeek模型的成本,但其似乎只是OpenAI或Meta最佳产品的一个零头。该模型的效率高出了这么多,使得人们怀疑斥巨资购买英伟达等公司最新、最强大AI加速器的必要性。

DeepSeek R1在几个主要基准测评中的表现接近或优于竞争对手模型,例如数学领域的2024年美国数学邀请赛、常识领域的大规模多任务语言理解(MMLU)和问答领域的AlpacaEval 2.0。在加州大学伯克利分校相关的排行榜Chatbot Arena上,该模型也名列前茅。

DeepSeek何时引发的全球关注?

自2023年发布最早一版模型以来,这家AI开发商就受到了密切关注。然后在11月,它向世界展示了一下旨在模仿人类思维模式的DeepSeek R1推理模型。该模式支撑起了其移动聊天机器人app,今年1月,作为一种比OpenAI便宜得多的替代品,其app及网页版在全球声名鹊起,投资人Marc Andreessen称其为“AI的人造卫星时刻”。

市场跟踪机构App Figures的数据显示,截至1月25日,DeepSeek移动app在澳大利亚、加拿大、中国、新加坡、美国和英国的iPhone应用商店下载量达到160万次,排名第一。

DeepSeek的创始人是谁?

梁文锋1985年出生于广东,拥有浙江大学信息与电子工程系学士和硕士学位。天眼查数据显示,他创立DeepSeek的注册资本只有1000万元人民币。

梁文锋曾表示,主要员工大多是中国顶尖高校的应届毕业生,并强调英伟达的领先是整个西方技术社区和产业共同努力的结果,中国AI的发展需要类似的生态。

“更多的投入并不一定产生更多的创新,否则大厂可以把所有的创新包揽了,”他说。

DeepSeek在中国AI版图中处于什么位置?

从阿里巴巴集团、百度到腾讯,中国的科技龙头企业投入了大量资金和资源来为它们的AI企业获取硬件和客户。DeepSeek和李开复的初创公司“零一万物”则另辟蹊径,采取了开源方式,旨在快速招募尽可能多的用户,然后再以这些大量用户为基础制定变现策略。

由于DeepSeek的模型更便宜,它已经在帮助降低中国开发AI成本方面发挥了作用;大公司打起了价格战,在过去一年半时间里已经多轮降价。

对全球AI市场影响几何?

DeepSeek的成功可能会促使OpenAI和其他美国供应商降价以保持现有的领先地位。如果更高效的模型能够以少得多的支出参与竞争,那么人们就会质疑Meta和微软等公司的巨额支出 —— 它们分别承诺了今年至少650亿美元的资本支出、主要是在AI基础设施上。

全球市场掀起风浪,阿斯麦、英伟达等之前受益于AI服务需求欣欣向荣的股票大跌。科大讯飞等与DeepSeek相关的中国股票上涨。

世界各地的开发人员已然在测试DeepSeek的软件,并考虑用它来构建工具。这可能会加速先进AI推理模型的采用 —— 同时也可能引发对是否需要限制使用的更多担忧。DeepSeek的进步可能会加紧旨在控制AI开发的监管。

DeepSeek有什么缺点?

DeepSeek的云基础设施可能会经受流量激增的考验。该公司曾在1月27日短暂大宕机,而随着新老用户向其聊天机器人发去更多问题,其将得管理甚至更大的流量。

科技分类资讯推荐

Pura80Pro与Mate70Pro,谁是华为旗舰更优解?一文看懂 - 天天要闻

Pura80Pro与Mate70Pro,谁是华为旗舰更优解?一文看懂

每当华为旗舰新机临近发布节点,科技圈的焦点就会转移到“新旧旗舰”之间的对比上,这也是许多消费者最关注的问题之一,比如即将在6月11日发布的“Pura80 Pro”以及已经上市半年的“Mate70 Pro”,一款是华为在影像领域进一步突破的全
周鸿祎:准备干掉360整个市场部,每年能省几千万 - 天天要闻

周鸿祎:准备干掉360整个市场部,每年能省几千万

6月6日晚,360集团创始人、董事长周鸿祎在其个人自媒体账号发文称,“我准备干掉360整个市场部,这样一年可以给公司省下几千万。”他表示从当天起,要做一个挑战,一个人完成一场完整的新产品发布会。“听起来像天方夜谭,但这次我准备动真格的了。”周鸿祎称,过去做一个产品发布会,需要市场部几十号人,忙活大半个月,费...
新疆低空经济加力扩容 - 天天要闻

新疆低空经济加力扩容

天山网/新疆日报记者 马伊宁不久前,“阿勒泰低空飞行服务保障中心”及“布尔津、富蕴低空飞行服务保障站”投入运营。作为拥有世界级旅游资源的区域,阿勒泰地区正构建覆盖北疆的低空飞行服务网络,为通用航空、无人机物流、低空旅游等业态提供全链条服务保
特斯拉“擎天柱”人形机器人项目负责人宣布离职 - 天天要闻

特斯拉“擎天柱”人形机器人项目负责人宣布离职

中新网6月7日电(吴家驹)综合外媒报道,特斯拉“擎天柱”(Optimus)人形机器人项目负责人米兰·科瓦奇(Milan Kovac)周五表示,他将离开公司。 科瓦奇在X平台上发文称,“我不得不做出一生中最艰难的决定,我将离开我的职位。我离家太久了,需要花更多的时间和国外的家人在一起。”科瓦奇称,这是“唯一的原因,与其他任何事情...
512GB售价2039元!3840HZ+7550mAh+极窄直屏,红米手机价格亲民了 - 天天要闻

512GB售价2039元!3840HZ+7550mAh+极窄直屏,红米手机价格亲民了

卡顿可以说是很多消费者使用手机时遇到的最为头疼的情况,好在就如今新发布的机型就算是在长时间的使用之下,也并不会让你出现如此的情况,这就比如说红米Turbo 4 Pro这款机型就是如此,这款机型不仅性能狂飙、续航超长,更有旗舰级配置和贴心细节