文心大模型X1代码、数学、推理能力超越最新版DeepSeek V3!即将上线千帆大模型平台

今日,据媒体报道,在多个公开数据集测评中,百度最新发布的文心大模型x1,在数学、代码、推理等能力上表现优异,超越升级后的deepseek-v3-0324。

在数学场景中,gsm8k数据集测试后结果显示,文心x1得分95.6,deepseek-v3-0324得分93.6;代码生成层面,humaneval数据集测试后结果显示,文心x1得分90.9,deepseek-v3-0324得分86.6;在知识推理层面,c-eval数据集测试后结果显示,文心大模型x1得分88.6,deepseek-v3-0324得分85.1。

近日,deepseek官方宣布v3模型完成小版本升级的消息,包括推理、前端开发、中文写作、中文搜索几个方面的能力优化。

而在不久前,百度正式发布文心大模型x1,具备更强的理解、规划、反思、进化能力。文心x1由百度的慢思考技术发展而来。作为能力更全面的深度思考模型,兼备准确、创意和文采,在中文知识问答、文学创作、文稿写作、日常对话、逻辑推理、复杂计算及工具调用等方面表现尤为出色。

据悉,文心大模型x1即将上线千帆大模型平台,api调用价格为deepseek-r1调用价格的50%。(古雨)