文心大模型X1代码、数学、推理能力超越最新版DeepSeek V3!即将上线千帆大模型平台

2025年03月26日22:20:36 科技 6555

今日,据媒体报道,在多个公开数据集测评中,百度最新发布的文心大模型x1,在数学、代码、推理等能力上表现优异,超越升级后的deepseek-v3-0324。

在数学场景中,gsm8k数据集测试后结果显示,文心x1得分95.6,deepseek-v3-0324得分93.6;代码生成层面,humaneval数据集测试后结果显示,文心x1得分90.9,deepseek-v3-0324得分86.6;在知识推理层面,c-eval数据集测试后结果显示,文心大模型x1得分88.6,deepseek-v3-0324得分85.1。

文心大模型X1代码、数学、推理能力超越最新版DeepSeek V3!即将上线千帆大模型平台 - 天天要闻

近日,deepseek官方宣布v3模型完成小版本升级的消息,包括推理、前端开发、中文写作、中文搜索几个方面的能力优化。

而在不久前,百度正式发布文心大模型x1,具备更强的理解、规划、反思、进化能力。文心x1由百度的慢思考技术发展而来。作为能力更全面的深度思考模型,兼备准确、创意和文采,在中文知识问答、文学创作、文稿写作、日常对话、逻辑推理、复杂计算及工具调用等方面表现尤为出色。

据悉,文心大模型x1即将上线千帆大模型平台,api调用价格为deepseek-r1调用价格的50%。(古雨)

科技分类资讯推荐

中国关系型数据库软件市场年复合增长率超20%,软件ETF连续3天净流入超亿元 - 天天要闻

中国关系型数据库软件市场年复合增长率超20%,软件ETF连续3天净流入超亿元

截至2025年6月20日 13:02,中证软件服务指数下跌1.29%。成分股方面,国联股份领跌,电科网安、太极股份、恒生电子、启明星辰跟跌。软件ETF(159852)回调蓄势。拉长时间看,截至2025年6月19日,软件ETF近1年累计上涨29.13%。流动性方面,软件ETF盘中换手3.44%,成交1.01亿元。拉长时间看,截至6月19日,软件ETF近1年日均
荣耀GT Pro续航称霸 vs vivo S30 Pro mini轻薄碾压! - 天天要闻

荣耀GT Pro续航称霸 vs vivo S30 Pro mini轻薄碾压!

当7200mAh怪兽电池遇上186g羽量级机身,2025年这两款旗舰究竟谁能笑到最后?我们通过四款新机的硬核参数,揭晓不同需求的终极答案。荣耀 GT Pro:性能与续航的双料王者骁龙8 Elite领先版+144Hz电竞屏的组合,让这款手机成
荣耀Magic V5登场:最薄大折叠+最强AI,手机行业的下一站答案 - 天天要闻

荣耀Magic V5登场:最薄大折叠+最强AI,手机行业的下一站答案

在2025年AI技术迅猛发展的浪潮中,行业各大厂商竞相发力,而苹果则显得动作迟缓。在刚刚落幕的苹果WWDC2025上,苹果将升级重点放在全新界面UI上,AI创新不足且国行版仍无期,让用户直呼失望,有媒体称“这应该是苹果近些年最无聊的一场WWDC了”。6月19日在上海MWC期间,荣耀召开了AI技术沟通会,深度阐释其在 AI 领域的技术...
2025商旅平台盘点:AI驱动下的商旅平台 - 天天要闻

2025商旅平台盘点:AI驱动下的商旅平台

当 AI 大模型开始重构企业管理流程,2025 年的中国商旅市场正经历一场从 “资源竞争” 到 “技术革命” 的深层变革。据行业数据显示,智能商旅平台渗透率已大大突破 ,AI 驱动的商旅管理自动化使企业商旅成本显著下降 ,这场由技术主导的生态重构,正在重新定义企业商旅管理的价值边界。适合大中型企业的综合型平台:分贝通...
为了追剧年轻人整活有多野?这些都是小场面! - 天天要闻

为了追剧年轻人整活有多野?这些都是小场面!

大家知道现在的年轻人为了追剧到底有多拼么?每天花在追剧这件事情上的时间也是超乎大家的想象!根据有关数据显示近四成中国观众(39.57%)在碎片时间里见缝插针,更有超过三成在睡意朦胧中仍要刷完一集才肯闭眼。这种在片刻闲暇牢牢抓住那份属于自己的