文心大模型X1代碼、數學、推理能力超越最新版DeepSeek V3!即將上線千帆大模型平台

2025年03月26日22:20:36 科技 6555

今日,據媒體報道,在多個公開數據集測評中,百度最新發布的文心大模型x1,在數學、代碼、推理等能力上表現優異,超越升級後的deepseek-v3-0324。

在數學場景中,gsm8k數據集測試後結果顯示,文心x1得分95.6,deepseek-v3-0324得分93.6;代碼生成層面,humaneval數據集測試後結果顯示,文心x1得分90.9,deepseek-v3-0324得分86.6;在知識推理層面,c-eval數據集測試後結果顯示,文心大模型x1得分88.6,deepseek-v3-0324得分85.1。

文心大模型X1代碼、數學、推理能力超越最新版DeepSeek V3!即將上線千帆大模型平台 - 天天要聞

近日,deepseek官方宣布v3模型完成小版本升級的消息,包括推理、前端開發、中文寫作、中文搜索幾個方面的能力優化。

而在不久前,百度正式發布文心大模型x1,具備更強的理解、規劃、反思、進化能力。文心x1由百度的慢思考技術發展而來。作為能力更全面的深度思考模型,兼備準確、創意和文采,在中文知識問答、文學創作、文稿寫作、日常對話、邏輯推理、複雜計算及工具調用等方面表現尤為出色。

據悉,文心大模型x1即將上線千帆大模型平台,api調用價格為deepseek-r1調用價格的50%。(古雨)

科技分類資訊推薦

iPhone一鍵降溫?蘋果這隱藏模式有點過分啊 - 天天要聞

iPhone一鍵降溫?蘋果這隱藏模式有點過分啊

為了解決發熱這亘古難題,手機廠商絞盡腦汁,往手機里塞散熱膜、均熱板、填充硅脂,甚至還用上了主動風扇。 但到了夏天三四十度的室外,該發熱還是發熱,該燙手還是燙手。 國產安卓如此。 ....
三星Galaxy S26Ultra不裝了,性能太炸裂了! - 天天要聞

三星Galaxy S26Ultra不裝了,性能太炸裂了!

三星Galaxy S26 Ultra即將亮相,帶來多方面升級。·該機型將採用6.9英寸QHD+LTPO AMOLED顯示屏,支持120Hz自適應刷新率和3000尼特峰值亮度,確保在各種光照條件下都能提供清晰的視覺體驗。
中集洋山集裝箱第三季度訂單飽滿 開拓氫能集成裝備求新|公司調研 - 天天要聞

中集洋山集裝箱第三季度訂單飽滿 開拓氫能集成裝備求新|公司調研

財聯社7月5日訊(記者 胡皓瓊)中美關稅緩和之下,外貿企業對美出貨恢復,帶動中集洋山集裝箱製造訂單增長。集裝箱製造廠在提升自動化水平的同時,為提高自身抗風險能力,還正布局新賽道。財聯社記者近日走訪中集集團(000039.SZ)旗下中集洋山,眼見一片片鋼板,經歷衝壓、焊接組裝、打砂等一道道工序,逐漸成形。產線上布...
數據寶一體機實機首秀2025生態文明貴陽國際論壇 - 天天要聞

數據寶一體機實機首秀2025生態文明貴陽國際論壇

7月5日至6日,2025年生態文明貴陽國際論壇召開,數據寶攜其AI技術領先成果重磅亮相論壇人工智慧展區,並以「企業私域業務模型一體機」實機首秀,現場演繹數據資產與AI深度賦能綠色發展的創新融合實踐。數據寶「企業私域業務模型一體機」。
登上C909樣機,聽聽中國商飛工程總師怎麼說?《明青講習所》又上新了 - 天天要聞

登上C909樣機,聽聽中國商飛工程總師怎麼說?《明青講習所》又上新了

名師金課《明青講習所》今又上新,這期節目《「科學家精神」的迴響》聚焦於「科學家精神的時代傳承」,定於7月5日(周六)19:30 在上海教育電視台首播。陳明青老師帶領華東師範大學第一附屬中學、上海市魯迅中學、上海南湖職業技術學院的學生們,踏上沉浸式學習之旅,走進錢學森圖書館、中國商飛上海飛機設計研究院、上海科...