文心大模型X1代碼、數學、推理能力超越最新版DeepSeek V3!即將上線千帆大模型平台

2025年03月26日22:20:36 科技 6555

今日,據媒體報道,在多個公開數據集測評中,百度最新發布的文心大模型x1,在數學、代碼、推理等能力上表現優異,超越升級後的deepseek-v3-0324。

在數學場景中,gsm8k數據集測試後結果顯示,文心x1得分95.6,deepseek-v3-0324得分93.6;代碼生成層面,humaneval數據集測試後結果顯示,文心x1得分90.9,deepseek-v3-0324得分86.6;在知識推理層面,c-eval數據集測試後結果顯示,文心大模型x1得分88.6,deepseek-v3-0324得分85.1。

文心大模型X1代碼、數學、推理能力超越最新版DeepSeek V3!即將上線千帆大模型平台 - 天天要聞

近日,deepseek官方宣布v3模型完成小版本升級的消息,包括推理、前端開發、中文寫作、中文搜索幾個方面的能力優化。

而在不久前,百度正式發布文心大模型x1,具備更強的理解、規劃、反思、進化能力。文心x1由百度的慢思考技術發展而來。作為能力更全面的深度思考模型,兼備準確、創意和文采,在中文知識問答、文學創作、文稿寫作、日常對話、邏輯推理、複雜計算及工具調用等方面表現尤為出色。

據悉,文心大模型x1即將上線千帆大模型平台,api調用價格為deepseek-r1調用價格的50%。(古雨)

科技分類資訊推薦

OPPO Reno14 系列亮相,實況照片體驗再進化 - 天天要聞

OPPO Reno14 系列亮相,實況照片體驗再進化

OPPO 正式發布新一代科技潮品 Reno14 系列,首發流光幻影工藝,打造全新潮流 "人魚姬" 配色 。Reno14 系列集高清長焦實況照片、4K 視頻轉實況照片、閃光實況照片等多種潮流玩法於一身....
多巴胺風暴來襲!vivo S30系列攜活力美學燃爆初夏 - 天天要聞

多巴胺風暴來襲!vivo S30系列攜活力美學燃爆初夏

當手機不再只是通訊工具,而是個性表達的潮流符號,vivo S系列再次引領年輕化設計浪潮。近日,vivo官方正式宣布:全新vivo S30系列新品發布會將於5月29日晚盛大啟幕,一場關於色彩、輕薄與科技的狂歡即將上演!
算力衛星上天組網,有望受益11家企業介紹 - 天天要聞

算力衛星上天組網,有望受益11家企業介紹

數字時代我們如何準確認知這個世界?算力上天在軌組網激活了哪些產業鏈環節?兄弟們,最近幾天在酒泉第一組12顆太空超算衛星成功發射組網了。這幾天很多博主已經告訴我們這個東西有多牛,這不我都在腦補未來可以實現的幾十種場景了。前段時間不是都是炒作深
華為nova14系列正式亮相,史上最強nova搭載紅楓多光譜原色鏡頭 - 天天要聞

華為nova14系列正式亮相,史上最強nova搭載紅楓多光譜原色鏡頭

【TechWeb】5月19日,在nova 14系列及鴻蒙電腦新品發布會上,華為nova 14系列手機正式亮相,並在影像力方面帶來全新升級,nova系列自2016年誕生以來,始終以人像攝影為自身核心發展方向之一,並以持續不斷地軟硬體協同創新,讓每代產品在移動影像方面帶來極為出色的表現。隨著多年來穩紮穩打的發展,華為nova系列帶來多個影...
「零感知」併網!湖北荊州為迎峰度夏早準備 - 天天要聞

「零感知」併網!湖北荊州為迎峰度夏早準備

極目新聞記者 高偉通訊員 胡斌「天氣漸漸熱起來了,我們及時開展中壓發電車併網演練,為即將到來的迎峰度夏保電早做準備。」國網荊州供電公司配電部負責人謝燦明告訴極目新聞記者。近日,荊州供電公司在荊州市經開區,開展了一場中壓發電車同期併網接入迎峰度夏應急演練。應急演練現場演練現場,兩台絕緣斗臂車、一台3000千...
鴻蒙電腦登場,1000+應用適配+跨端協同,能否撼動操作系統市場格局? - 天天要聞

鴻蒙電腦登場,1000+應用適配+跨端協同,能否撼動操作系統市場格局?

【環球網科技報道 記者 張陽】長期以來,電腦作為我們重要的生產力工具,其核心操作系統市場卻幾乎完全掌握在微軟的Windows和蘋果的MacOS手中。直至2025年5月19日,華為在nova 14系列及鴻蒙電腦發布會上,正式發布全新鴻蒙電腦HUAWEI MateBook Pro與非凡大師家族全新成員HUAWEI MateBook Fold非凡大師,鴻蒙電腦的正