文心大模型X1代码、数学、推理能力超越最新版DeepSeek V3!即将上线千帆大模型平台

2025年03月26日22:20:36 科技 6555

今日,据媒体报道,在多个公开数据集测评中,百度最新发布的文心大模型x1,在数学、代码、推理等能力上表现优异,超越升级后的deepseek-v3-0324。

在数学场景中,gsm8k数据集测试后结果显示,文心x1得分95.6,deepseek-v3-0324得分93.6;代码生成层面,humaneval数据集测试后结果显示,文心x1得分90.9,deepseek-v3-0324得分86.6;在知识推理层面,c-eval数据集测试后结果显示,文心大模型x1得分88.6,deepseek-v3-0324得分85.1。

文心大模型X1代码、数学、推理能力超越最新版DeepSeek V3!即将上线千帆大模型平台 - 天天要闻

近日,deepseek官方宣布v3模型完成小版本升级的消息,包括推理、前端开发、中文写作、中文搜索几个方面的能力优化。

而在不久前,百度正式发布文心大模型x1,具备更强的理解、规划、反思、进化能力。文心x1由百度的慢思考技术发展而来。作为能力更全面的深度思考模型,兼备准确、创意和文采,在中文知识问答、文学创作、文稿写作、日常对话、逻辑推理、复杂计算及工具调用等方面表现尤为出色。

据悉,文心大模型x1即将上线千帆大模型平台,api调用价格为deepseek-r1调用价格的50%。(古雨)

科技分类资讯推荐

OPPO Reno14 系列亮相,实况照片体验再进化 - 天天要闻

OPPO Reno14 系列亮相,实况照片体验再进化

OPPO 正式发布新一代科技潮品 Reno14 系列,首发流光幻影工艺,打造全新潮流 "人鱼姬" 配色 。Reno14 系列集高清长焦实况照片、4K 视频转实况照片、闪光实况照片等多种潮流玩法于一身....
多巴胺风暴来袭!vivo S30系列携活力美学燃爆初夏 - 天天要闻

多巴胺风暴来袭!vivo S30系列携活力美学燃爆初夏

当手机不再只是通讯工具,而是个性表达的潮流符号,vivo S系列再次引领年轻化设计浪潮。近日,vivo官方正式宣布:全新vivo S30系列新品发布会将于5月29日晚盛大启幕,一场关于色彩、轻薄与科技的狂欢即将上演!
算力卫星上天组网,有望受益11家企业介绍 - 天天要闻

算力卫星上天组网,有望受益11家企业介绍

数字时代我们如何准确认知这个世界?算力上天在轨组网激活了哪些产业链环节?兄弟们,最近几天在酒泉第一组12颗太空超算卫星成功发射组网了。这几天很多博主已经告诉我们这个东西有多牛,这不我都在脑补未来可以实现的几十种场景了。前段时间不是都是炒作深
华为nova14系列正式亮相,史上最强nova搭载红枫多光谱原色镜头 - 天天要闻

华为nova14系列正式亮相,史上最强nova搭载红枫多光谱原色镜头

【TechWeb】5月19日,在nova 14系列及鸿蒙电脑新品发布会上,华为nova 14系列手机正式亮相,并在影像力方面带来全新升级,nova系列自2016年诞生以来,始终以人像摄影为自身核心发展方向之一,并以持续不断地软硬件协同创新,让每代产品在移动影像方面带来极为出色的表现。随着多年来稳扎稳打的发展,华为nova系列带来多个影...
“零感知”并网!湖北荆州为迎峰度夏早准备 - 天天要闻

“零感知”并网!湖北荆州为迎峰度夏早准备

极目新闻记者 高伟通讯员 胡斌“天气渐渐热起来了,我们及时开展中压发电车并网演练,为即将到来的迎峰度夏保电早做准备。”国网荆州供电公司配电部负责人谢灿明告诉极目新闻记者。近日,荆州供电公司在荆州市经开区,开展了一场中压发电车同期并网接入迎峰度夏应急演练。应急演练现场演练现场,两台绝缘斗臂车、一台3000千...
鸿蒙电脑登场,1000+应用适配+跨端协同,能否撼动操作系统市场格局? - 天天要闻

鸿蒙电脑登场,1000+应用适配+跨端协同,能否撼动操作系统市场格局?

【环球网科技报道 记者 张阳】长期以来,电脑作为我们重要的生产力工具,其核心操作系统市场却几乎完全掌握在微软的Windows和苹果的MacOS手中。直至2025年5月19日,华为在nova 14系列及鸿蒙电脑发布会上,正式发布全新鸿蒙电脑HUAWEI MateBook Pro与非凡大师家族全新成员HUAWEI MateBook Fold非凡大师,鸿蒙电脑的正