3月11日,据东方财经援引媒体报道,有市场消息称,deepseek下一代ai模型deepseek-r2或提前于下周一(3月17日)正式发布。
deepseek-r2在多个关键领域实现突破,包括更出色的编程能力、多语言推理能力,以及以更低的成本提供更高的准确性。专业人士认为,这些特性若得以兑现,可能使其在全球ai竞赛中占据显著优势。

图源:vcg
deepseek,全称杭州深度求索人工智能基础技术研究有限公司,成立于2023年7月17日,是一家创新型科技公司,专注于开发先进的大语言模型(llm)和相关技术。
根据deepseek公布的deepseek-r1信息显示,其在后训练阶段(post-training)大规模使用了强化学习(reinforcement learning)技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。在数学、代码、自然语言推理等任务上,性能比肩openai o1正式版。
近期,deepseek访问使用量急速上升,已经成为目前最快突破3000万日活跃用户量的应用程序。
据央视新闻报道,记者从工业和信息化部了解到,三家基础电信企业已全面接入国产开源大模型deepseek。除了运营商的云平台外,手机、pc等终端厂商也在积极拥抱deepseek,一些地方政府也开始在政务系统部署deepseek。
技术人员介绍,首款搭载deepseek模型的安卓手机,除了ai任务处理效率大幅提高以外,接入deepseek后还将为用户带来深度思考、个性化服务等更加智能化的交互体验。
deepseek之所以受到业内的追捧,主要在于其创新的算法和高性价比。它不仅优化了计算资源的使用,还为国产芯片的发展带来了新的契机,推动行业向高效和绿色方向迈进。
专家指出,deepseek最大的优势就是性价比高。作为一个超级智能“大脑”,它不仅聪明,而且用起来还很划算。
微信编辑:吴祈
审核:林夕合
【来源:九派新闻综合东方财经、央视新闻、此前报道】
声明:此文版权归原作者所有,若有来源错误或者侵犯您的合法权益,您可通过邮箱与我们取得联系,我们将及时进行处理。邮箱地址:[email protected]