文心大模型X1代碼、數學、推理能力超越最新版DeepSeek V3!即將上線千帆大模型平台

今日,據媒體報道,在多個公開數據集測評中,百度最新發佈的文心大模型x1,在數學、代碼、推理等能力上表現優異,超越升級後的deepseek-v3-0324。

在數學場景中,gsm8k數據集測試後結果顯示,文心x1得分95.6,deepseek-v3-0324得分93.6;代碼生成層面,humaneval數據集測試後結果顯示,文心x1得分90.9,deepseek-v3-0324得分86.6;在知識推理層面,c-eval數據集測試後結果顯示,文心大模型x1得分88.6,deepseek-v3-0324得分85.1。

近日,deepseek官方宣布v3模型完成小版本升級的消息,包括推理、前端開發、中文寫作、中文搜索幾個方面的能力優化。

而在不久前,百度正式發佈文心大模型x1,具備更強的理解、規劃、反思、進化能力。文心x1由百度的慢思考技術發展而來。作為能力更全面的深度思考模型,兼備準確、創意和文采,在中文知識問答、文學創作、文稿寫作、日常對話、邏輯推理、複雜計算及工具調用等方面表現尤為出色。

據悉,文心大模型x1即將上線千帆大模型平台,api調用價格為deepseek-r1調用價格的50%。(古雨)