文心大模型X1代碼、數學、推理能力超越最新版DeepSeek V3！即將上線千帆大模型平台

分類：科技

瀏覽數：6555

2025-03-26

今日，據媒體報道，在多個公開數據集測評中，百度最新發佈的文心大模型x1，在數學、代碼、推理等能力上表現優異，超越升級後的deepseek-v3-0324。

在數學場景中，gsm8k數據集測試後結果顯示，文心x1得分95.6，deepseek-v3-0324得分93.6；代碼生成層面，humaneval數據集測試後結果顯示，文心x1得分90.9，deepseek-v3-0324得分86.6；在知識推理層面，c-eval數據集測試後結果顯示，文心大模型x1得分88.6，deepseek-v3-0324得分85.1。

近日，deepseek官方宣布v3模型完成小版本升級的消息，包括推理、前端開發、中文寫作、中文搜索幾個方面的能力優化。

而在不久前，百度正式發佈文心大模型x1，具備更強的理解、規劃、反思、進化能力。文心x1由百度的慢思考技術發展而來。作為能力更全面的深度思考模型，兼備準確、創意和文采，在中文知識問答、文學創作、文稿寫作、日常對話、邏輯推理、複雜計算及工具調用等方面表現尤為出色。

據悉，文心大模型x1即將上線千帆大模型平台，api調用價格為deepseek-r1調用價格的50%。（古雨）

科技分類資訊推薦