文心大模型X1代碼、數學、推理能力超越最新版DeepSeek V3!即將上線千帆大模型平台

2025年03月26日22:20:36 科技 6555

今日,據媒體報道,在多個公開數據集測評中,百度最新發布的文心大模型x1,在數學、代碼、推理等能力上表現優異,超越升級後的deepseek-v3-0324。

在數學場景中,gsm8k數據集測試後結果顯示,文心x1得分95.6,deepseek-v3-0324得分93.6;代碼生成層面,humaneval數據集測試後結果顯示,文心x1得分90.9,deepseek-v3-0324得分86.6;在知識推理層面,c-eval數據集測試後結果顯示,文心大模型x1得分88.6,deepseek-v3-0324得分85.1。

文心大模型X1代碼、數學、推理能力超越最新版DeepSeek V3!即將上線千帆大模型平台 - 天天要聞

近日,deepseek官方宣布v3模型完成小版本升級的消息,包括推理、前端開發、中文寫作、中文搜索幾個方面的能力優化。

而在不久前,百度正式發布文心大模型x1,具備更強的理解、規劃、反思、進化能力。文心x1由百度的慢思考技術發展而來。作為能力更全面的深度思考模型,兼備準確、創意和文采,在中文知識問答、文學創作、文稿寫作、日常對話、邏輯推理、複雜計算及工具調用等方面表現尤為出色。

據悉,文心大模型x1即將上線千帆大模型平台,api調用價格為deepseek-r1調用價格的50%。(古雨)

科技分類資訊推薦

樂道 L90 官方諜照發布!計劃 2025 上海車展亮相 - 天天要聞

樂道 L90 官方諜照發布!計劃 2025 上海車展亮相

4 月 3 日,樂道品牌官方發布了旗下 L90 車型的諜照,新車計劃於 2025 年 4 月上海車展正式亮相,這一消息在車迷圈引發了熱烈討論。作為樂道品牌第二款重磅車型,L90 承載了消費者對高品質出行的期待。如果有感興趣的朋友,可以來了解一下。
長安啟源Q07正式預售,13.98萬元起,預訂可享7重先享禮 - 天天要聞

長安啟源Q07正式預售,13.98萬元起,預訂可享7重先享禮

3月31日,長安啟源Q07先享預訂發布會在雲南大理舉行,「全家人的智能SUV」——長安啟源Q07正式開啟預售,預售價13.98萬元起,共推出5個版本,並首發月華銀限定色,為不同需求的家庭用戶提供自由選擇,更有7重先享預訂專屬好禮,大訂用戶可享「大訂1999抵4
便宜買奇瑞,個性買阿維塔,檔次上問界,最保值的不是雷克薩斯 - 天天要聞

便宜買奇瑞,個性買阿維塔,檔次上問界,最保值的不是雷克薩斯

出了便宜,奇瑞的安全性也不錯。目前奇瑞車系共有26個車系在售,奇瑞新能源有5個車系在售,而奇瑞高端品牌星途有8個車系在售。奇瑞汽車的品系越來越多,產品也越來越豐富。正所謂「樹大招風」,這麼多的車型安全性是否有保障呢?以瑞虎7的碰撞車試為例,該車正面100%碰撞
康邁輪端主掛一體:安全、經濟、高效 - 天天要聞

康邁輪端主掛一體:安全、經濟、高效

在運輸運營中車輛出勤率和維保成本至關重要當主車配備康邁免維護輪端而挂車輪端卻仍需頻繁進站保養時則會嚴重影響整車高效運營康邁開發了與主車輪端相同技術標準的挂車免維護輪端產品實現康邁輪端主掛一體化軸承游隙預調整技術賦能挂車康邁作為行業技術引領者將北美先進輪端油潤滑