文心大模型X1代码、数学、推理能力超越最新版DeepSeek V3!即将上线千帆大模型平台

2025年03月26日22:20:36 科技 6555

今日,据媒体报道,在多个公开数据集测评中,百度最新发布的文心大模型x1,在数学、代码、推理等能力上表现优异,超越升级后的deepseek-v3-0324。

在数学场景中,gsm8k数据集测试后结果显示,文心x1得分95.6,deepseek-v3-0324得分93.6;代码生成层面,humaneval数据集测试后结果显示,文心x1得分90.9,deepseek-v3-0324得分86.6;在知识推理层面,c-eval数据集测试后结果显示,文心大模型x1得分88.6,deepseek-v3-0324得分85.1。

文心大模型X1代码、数学、推理能力超越最新版DeepSeek V3!即将上线千帆大模型平台 - 天天要闻

近日,deepseek官方宣布v3模型完成小版本升级的消息,包括推理、前端开发、中文写作、中文搜索几个方面的能力优化。

而在不久前,百度正式发布文心大模型x1,具备更强的理解、规划、反思、进化能力。文心x1由百度的慢思考技术发展而来。作为能力更全面的深度思考模型,兼备准确、创意和文采,在中文知识问答、文学创作、文稿写作、日常对话、逻辑推理、复杂计算及工具调用等方面表现尤为出色。

据悉,文心大模型x1即将上线千帆大模型平台,api调用价格为deepseek-r1调用价格的50%。(古雨)

科技分类资讯推荐

人形机器人加速“进化”新时代画卷 - 天天要闻

人形机器人加速“进化”新时代画卷

人形机器人的“进化之旅”在科技的璀璨星河中,人形机器人宛如一颗耀眼的新星,正以惊人的速度加速“进化”,开启属于它们的新时代画卷。从“蹒跚学步”到“小步快跑”曾几何时,人形机器人还处在Demo演示和静态展览的阶段,如同初生婴儿般对世界充满好奇
小米:犯罪团伙操纵近万账号诋毁小米,犯罪金额巨大 - 天天要闻

小米:犯罪团伙操纵近万账号诋毁小米,犯罪金额巨大

据@小米法务部 5月19日消息:2025年5月15日,公司从司法机关处获悉,此前公司报案的一起有组织、有预谋的网络黑公关案件,已经告破。目前,公安机关已依法对多名犯罪嫌疑人采取刑事强制措施,案件还在进一步调查。据了解,自2024年12月起,直至近期小米汽车相关的系列热点事件,该犯罪团伙利用文案自动生成软件捏造关于小米...
QQ浏览器推出QBot:全面升级为AI浏览器 聚合5大AI新能力 - 天天要闻

QQ浏览器推出QBot:全面升级为AI浏览器 聚合5大AI新能力

快科技5月19日消息,QQ浏览器宣布推出QBot,升级为AI浏览器,搭载腾讯混元和DeepSeek双模型。升级后的QQ浏览器将成为超级助手,在浏览时提供多种AI功能,帮助用户更高效地获取和处理信息,满足工作、学习等需求。据悉,新版QQ浏览器可体验AI搜索、AI浏览、AI办公、AI学习、AI写作五大功能。如在搜索方面,支持用户以文字、...