1/8成本比肩Claude 3.7,Mistral Medium 3來了

2025年05月08日12:54:02 科技 1962

西風 發自 凹非寺

量子位 | 公眾號 QbitAI

用1/8成本比肩Claude 3.7,剛剛,「歐洲OpenAI」Mistral AI發布多模態新模型。

Mistral Medium 3,主打編程和多模態理解,且在性能和成本間進行了平衡。

1/8成本比肩Claude 3.7,Mistral Medium 3來了 - 天天要聞

官方稱,在各類基準測試中,Mistral Medium 3性能達到或超越Claude Sonnet 3.7的90%,且成本大大降低。

Claude 3.7 Sonnet的價格為每百萬輸入token 3美元,每百萬輸出token 15美元,而Mistral Medium 3:

每百萬輸入token僅0.4美元,每百萬輸出token 2美元

整體性能,不管是和領先開源模型Llama 4 Maverick還是和企業級模型Cohere Command A相比,Mistral Medium 3都能打得有來有回。

目前,Mistral Medium 3 API已在Mistral La Plateforme和Amazon Sagemaker上線,不久後還將在IBM WatsonX、NVIDIA NIM、Azure AI Foundry和Google Cloud Vertex上推出。

具備一系列企業級能力

下面具體來看看基準測試。

Mistral Medium 3在編程和STEM任務中尤為突出。

1/8成本比肩Claude 3.7,Mistral Medium 3來了 - 天天要聞

官方原話是「其性能甚至接近非常大且運行速度慢得多的競爭對手」。

不過呢,既不開放模型權重,也沒有透露模型大小……

1/8成本比肩Claude 3.7,Mistral Medium 3來了 - 天天要聞

另外,Mistral AI還發布了第三方人類評估。

人類評估中,Mistral Medium 3依舊是在編程方面佔優勢。

1/8成本比肩Claude 3.7,Mistral Medium 3來了 - 天天要聞

在多模態和其他人語言任務中,相比Llama 4 Maverick,Mistral Medium 3的表現也佔上風。

1/8成本比肩Claude 3.7,Mistral Medium 3來了 - 天天要聞

除了測試數據之外,官方還特彆強調了其適應企業環境的能力,包括:

  • 混合部署或本地 / 虛擬私有雲(VPC)內部署
  • 定製化後期訓練
  • 與企業工具和系統集成

企業可以輕鬆將智能全面集成到系統中,藉助Mistral的應用AI解決方案,該模型可以持續進行預訓練、全面微調,並融入企業知識庫,使其成為針對特定領域訓練、持續學習和自適應工作流程的高保真解決方案。

官方稱,金融服務、能源和醫療保健領域的客戶正在使用該模型測試,通過深入的背景信息來豐富客戶服務、實現業務流程的個性化,並對複雜的數據集進行分析。

1/8成本比肩Claude 3.7,Mistral Medium 3來了 - 天天要聞

另外,他們還推出了Le Chat Enterprise,這是一項面向企業的聊天機器人服務,提供了AI Agent建造器之類的工具,並將Mistral的模型與Gmail、Google Drive、SharePoint等第三方服務集成。

據了解,Le Chat Enterprise將很快支持 MCP。

Mistral Medium 3發布後引發大批網友關注,有網友為其「高性價比」點贊。

1/8成本比肩Claude 3.7,Mistral Medium 3來了 - 天天要聞

不過也有不少網友吐槽模型沒說開源結果又高調地和開源模型比較,有點奇怪。

1/8成本比肩Claude 3.7,Mistral Medium 3來了 - 天天要聞

還有行動派網友,想看什麼自己比較。

StabilityAI創始人翻出了Gemini 2.5 Flash的基準測試結果:

1/8成本比肩Claude 3.7,Mistral Medium 3來了 - 天天要聞

看後表示:

與Gemini 2.5 Flash競爭是多麼困難,Gemini 2.5 Flash成本比Mistral Medium 3低70%。

期待開源模型的發布,這是Mistral的關鍵優勢。

1/8成本比肩Claude 3.7,Mistral Medium 3來了 - 天天要聞

One More Thing

繼三月份推出Mistral Small、今日推出Mistral Medium後,Mistral AI透露接下來幾周正著手開發「大型」項目。

1/8成本比肩Claude 3.7,Mistral Medium 3來了 - 天天要聞

參考鏈接:
[1]https://mistral.ai/news/mistral-medium-3
[2]https://x.com/MistralAI/status/1920119463430500541
[3]https://techcrunch.com/2025/05/07/mistral-claims-its-newest-ai-model-delivers-leading-performance-for-the-price/

— 完 —

量子位 QbitAI · 頭條號簽約

關注我們,第一時間獲知前沿科技動態

科技分類資訊推薦

一鍵批量解綁APP賬號!中國聯通「二次號碼煥新」服務正式上線 - 天天要聞

一鍵批量解綁APP賬號!中國聯通「二次號碼煥新」服務正式上線

快科技5月8日消息,如今大量手機APP都與手機賬號強綁定,帶來很多便捷的同時,也讓「二次號碼」的用戶非常苦惱。「二次號碼」也就是運營商回收後重新啟用號碼,以往經常有用戶遇到無法註冊使用互聯網應用或登錄到前任機主賬號等問題,甚至還會出現頻繁收到前任機主的驗證碼、電話。為了應對這種情況,工信部指導基礎電信企...
72888元!徠卡發布M11-P Safari特別版相機:精緻如藝術品 - 天天要聞

72888元!徠卡發布M11-P Safari特別版相機:精緻如藝術品

快科技5月8日消息,今日,徠卡正式發布了M11 - P Safari特別版相機,其售價為72888元。這款相機在外觀設計上獨具匠心。它採用了經典的橄欖綠配色,以人造革材質進行橄欖綠覆皮,頂蓋則採用同色啞光漆面,營造出一種復古而神秘的氛圍。尤為引人注目的是,它用銀色螺絲取代了經典的「可樂標」,給人一種新穎又不失格調的視覺...
曝三星S25系列增產80萬台 由250萬台上調至330萬台 - 天天要聞

曝三星S25系列增產80萬台 由250萬台上調至330萬台

【CNMO科技消息】據外媒報道,三星正在加快提升旗艦手機的產量,以應對當前市場環境中的不確定性。韓國媒體透露,三星計劃在5月份額外生產80萬台Galaxy S25系列手機,這一舉動很可能是為了在關稅政策變動前儘可能多地將產品送入美國市場。 根據消息,三星已通知其零部件供應商,將在本月內生產共計1620萬台手機和平板設備,...
京東全球招人!薪酬不設上限 - 天天要聞

京東全球招人!薪酬不設上限

5月8日,「京東招聘」微信公眾號發布消息,宣布「京東TGT—頂尖青年技術天才計劃」全球啟動。據介紹,該計劃面向全球高校本碩博在校生、應屆生及畢業兩年內的技術人才開放招募,旨在與全球技術天才一起,基於京東豐富的業務場景探索前沿技術、用技術創造更多美好。在人才培養方面,京東表示將採取「技術導師+業務導師+成長...
小米太難了?緊急撤回更新或許只是開始 - 天天要聞

小米太難了?緊急撤回更新或許只是開始

話說從上次意外發生至今,小米汽車一直處在風口浪尖。近日,小米汽車又發布《關於大家關心問題的回答》,談到了最近爭議的限制馬力和碳纖維雙風道前艙蓋。其中,關於限制馬力的更新說道,已暫停了這次推送。至於已升級的少量用戶,小米汽車將會在下個版本更新