1/8成本比肩Claude 3.7,Mistral Medium 3來了

2025年05月08日12:54:02 科技 1962

西風 發自 凹非寺

量子位 | 公眾號 QbitAI

用1/8成本比肩Claude 3.7,剛剛,「歐洲OpenAI」Mistral AI發布多模態新模型。

Mistral Medium 3,主打編程和多模態理解,且在性能和成本間進行了平衡。

1/8成本比肩Claude 3.7,Mistral Medium 3來了 - 天天要聞

官方稱,在各類基準測試中,Mistral Medium 3性能達到或超越Claude Sonnet 3.7的90%,且成本大大降低。

Claude 3.7 Sonnet的價格為每百萬輸入token 3美元,每百萬輸出token 15美元,而Mistral Medium 3:

每百萬輸入token僅0.4美元,每百萬輸出token 2美元

整體性能,不管是和領先開源模型Llama 4 Maverick還是和企業級模型Cohere Command A相比,Mistral Medium 3都能打得有來有回。

目前,Mistral Medium 3 API已在Mistral La Plateforme和Amazon Sagemaker上線,不久後還將在IBM WatsonX、NVIDIA NIM、Azure AI Foundry和Google Cloud Vertex上推出。

具備一系列企業級能力

下面具體來看看基準測試。

Mistral Medium 3在編程和STEM任務中尤為突出。

1/8成本比肩Claude 3.7,Mistral Medium 3來了 - 天天要聞

官方原話是「其性能甚至接近非常大且運行速度慢得多的競爭對手」。

不過呢,既不開放模型權重,也沒有透露模型大小……

1/8成本比肩Claude 3.7,Mistral Medium 3來了 - 天天要聞

另外,Mistral AI還發布了第三方人類評估。

人類評估中,Mistral Medium 3依舊是在編程方面佔優勢。

1/8成本比肩Claude 3.7,Mistral Medium 3來了 - 天天要聞

在多模態和其他人語言任務中,相比Llama 4 Maverick,Mistral Medium 3的表現也佔上風。

1/8成本比肩Claude 3.7,Mistral Medium 3來了 - 天天要聞

除了測試數據之外,官方還特彆強調了其適應企業環境的能力,包括:

  • 混合部署或本地 / 虛擬私有雲(VPC)內部署
  • 定製化後期訓練
  • 與企業工具和系統集成

企業可以輕鬆將智能全面集成到系統中,藉助Mistral的應用AI解決方案,該模型可以持續進行預訓練、全面微調,並融入企業知識庫,使其成為針對特定領域訓練、持續學習和自適應工作流程的高保真解決方案。

官方稱,金融服務、能源和醫療保健領域的客戶正在使用該模型測試,通過深入的背景信息來豐富客戶服務、實現業務流程的個性化,並對複雜的數據集進行分析。

1/8成本比肩Claude 3.7,Mistral Medium 3來了 - 天天要聞

另外,他們還推出了Le Chat Enterprise,這是一項面向企業的聊天機器人服務,提供了AI Agent建造器之類的工具,並將Mistral的模型與Gmail、Google Drive、SharePoint等第三方服務集成。

據了解,Le Chat Enterprise將很快支持 MCP。

Mistral Medium 3發布後引發大批網友關注,有網友為其「高性價比」點贊。

1/8成本比肩Claude 3.7,Mistral Medium 3來了 - 天天要聞

不過也有不少網友吐槽模型沒說開源結果又高調地和開源模型比較,有點奇怪。

1/8成本比肩Claude 3.7,Mistral Medium 3來了 - 天天要聞

還有行動派網友,想看什麼自己比較。

StabilityAI創始人翻出了Gemini 2.5 Flash的基準測試結果:

1/8成本比肩Claude 3.7,Mistral Medium 3來了 - 天天要聞

看後表示:

與Gemini 2.5 Flash競爭是多麼困難,Gemini 2.5 Flash成本比Mistral Medium 3低70%。

期待開源模型的發布,這是Mistral的關鍵優勢。

1/8成本比肩Claude 3.7,Mistral Medium 3來了 - 天天要聞

One More Thing

繼三月份推出Mistral Small、今日推出Mistral Medium後,Mistral AI透露接下來幾周正著手開發「大型」項目。

1/8成本比肩Claude 3.7,Mistral Medium 3來了 - 天天要聞

參考鏈接:
[1]https://mistral.ai/news/mistral-medium-3
[2]https://x.com/MistralAI/status/1920119463430500541
[3]https://techcrunch.com/2025/05/07/mistral-claims-its-newest-ai-model-delivers-leading-performance-for-the-price/

— 完 —

量子位 QbitAI · 頭條號簽約

關注我們,第一時間獲知前沿科技動態

科技分類資訊推薦

「一網統管」「一網通辦」,看數字化轉型下的「山東方案」 - 天天要聞

「一網統管」「一網通辦」,看數字化轉型下的「山東方案」

近日,由山東省大數據局發起,大眾融媒承辦的「AI山東·媒體觀『數』」融媒體行活動啟動。記者走訪泰安、濟寧兩市,了解山東積極探索大數據、雲計算等數字技術在政務服務領域的應用成效。「一張圖」城市運行「一屏觀全城」走進泰安市大數據局,屏幕上「泰城的一天」數據實時跳動。這裡匯聚了泰安市105億條公共數據,60%以上...
你所不知道的「律動律享」6大免費福利攻略,請查收~ - 天天要聞

你所不知道的「律動律享」6大免費福利攻略,請查收~

發現·分享·秀 | Discover · Share· Show作為一名雲南律師或者準備成為律師的你一定聽說過「律動律享」但你不一定真正了解作為雲南律師行業垂直媒體矩陣人才交互平台品牌運營專業機構我們深植雲南律師行業關注行業發展 傳播行業資
王興興:宇樹科技年度營收已達10億元左右 - 天天要聞

王興興:宇樹科技年度營收已達10億元左右

北京商報訊(記者 李秀梅)6月26日,宇樹科技創始人王興興在2025夏季達沃斯論壇上表示,宇樹科技在2016年最早的時候只有自己一個人,到現在包括生產部門,員工已超千人。王興興透露,宇樹科技年度營收已達10億元左右。...
雷軍公布小米YU7實測里程:共計649萬公里 覆蓋全國296城 - 天天要聞

雷軍公布小米YU7實測里程:共計649萬公里 覆蓋全國296城

快科技6月26日消息,雷軍宣布小米YU7的道路實測里程已達649萬公里,覆蓋全國296個城市。自2024年初開始測試以來,歷經539天,工程師們駕駛YU7測試車經歷了極端環境,包括53攝氏度的吐魯番、零下41攝氏度的黑河以及海拔5380米的西藏阿里地區。小米YU7定位純電動中大型SUV,車身長寬高為4999/1996/1600mm,軸距3000mm。外觀沿.
瑞虎 7 雙車煥新上市,性價比王者再掀購車熱潮 - 天天要聞

瑞虎 7 雙車煥新上市,性價比王者再掀購車熱潮

6 月 17 日,奇瑞汽車旗下新款瑞虎 7 PLUS 與瑞虎 7 高能版正式上市,為緊湊型 SUV 市場注入了全新活力。作為年度改款車型,兩款新車在延續經典設計的同時,著重對配置與動力系統進行了升級,更令人驚喜的是,它們還帶來了極具吸引力的價格與購車權益,性價
支付寶「我的」界面大改版:一鍵直達更多常用功能 - 天天要聞

支付寶「我的」界面大改版:一鍵直達更多常用功能

快科技6月26日消息,最近有用戶發現,支付寶 「我的」 界面迎來改版。從界面來看,新版功能布局更高效、邏輯更通暢。新版將「銀行卡」「芝麻信用」「螞蟻保」等常用功能組合在一起橫向展示,用戶無需下滑,縮短查找路徑,提升操作效率。此外還加入了常用的民生服務,包括醫保、社保、住房公積金、個人養老金等服務,方便用...
中國消費新模式驅動內需提質擴容 - 天天要聞

中國消費新模式驅動內需提質擴容

這是6月24日在天津拍攝的2025海河國際消費論壇現場。新華社記者 趙子碩 攝新華社天津6月26日電 題:中國消費新模式驅動內需提質擴容新華社記者梁姊、宋瑞、李亭寵物主人為智能貓砂盆「豪擲千元」,盲盒玩具從中國商場火到美國超市,「新茶飲」成為年輕人健康度夏的飲品首選……在零售效率持續優化和年輕群體已成為消費主力...