1/8成本比肩Claude 3.7，Mistral Medium 3來了

2025年05月08日12:54:02 科技 1962

西風發自凹非寺
量子位 | 公眾號 QbitAI

用1/8成本比肩Claude 3.7，剛剛，“歐洲OpenAI”Mistral AI發布多模態新模型。

Mistral Medium 3，主打編程和多模態理解，且在性能和成本間進行了平衡。

官方稱，在各類基準測試中，Mistral Medium 3性能達到或超越Claude Sonnet 3.7的90%，且成本大大降低。

Claude 3.7 Sonnet的價格為每百萬輸入token 3美元，每百萬輸出token 15美元，而Mistral Medium 3：

每百萬輸入token僅0.4美元，每百萬輸出token 2美元。

整體性能，不管是和領先開源模型Llama 4 Maverick還是和企業級模型Cohere Command A相比，Mistral Medium 3都能打得有來有回。

目前，Mistral Medium 3 API已在Mistral La Plateforme和Amazon Sagemaker上線，不久後還將在IBM WatsonX、NVIDIA NIM、Azure AI Foundry和Google Cloud Vertex上推出。

具備一系列企業級能力

下面具體來看看基準測試。

Mistral Medium 3在編程和STEM任務中尤為突出。

官方原話是“其性能甚至接近非常大且運行速度慢得多的競爭對手”。

不過呢，既不開放模型權重，也沒有透露模型大小……

另外，Mistral AI還發布了第三方人類評估。

人類評估中，Mistral Medium 3依舊是在編程方面佔優勢。

在多模態和其他人語言任務中，相比Llama 4 Maverick，Mistral Medium 3的表現也佔上風。

除了測試數據之外，官方還特彆強調了其適應企業環境的能力，包括：

混合部署或本地 / 虛擬私有雲（VPC）內部署
定製化後期訓練
與企業工具和系統集成

企業可以輕鬆將智能全面集成到系統中，藉助Mistral的應用AI解決方案，該模型可以持續進行預訓練、全面微調，並融入企業知識庫，使其成為針對特定領域訓練、持續學習和自適應工作流程的高保真解決方案。

官方稱，金融服務、能源和醫療保健領域的客戶正在使用該模型測試，通過深入的背景信息來豐富客戶服務、實現業務流程的個性化，並對複雜的數據集進行分析。

另外，他們還推出了Le Chat Enterprise，這是一項面向企業的聊天機器人服務，提供了AI Agent建造器之類的工具，並將Mistral的模型與Gmail、Google Drive、SharePoint等第三方服務集成。

據了解，Le Chat Enterprise將很快支持 MCP。

Mistral Medium 3發布後引發大批網友關注，有網友為其“高性價比”點贊。

不過也有不少網友吐槽模型沒說開源結果又高調地和開源模型比較，有點奇怪。

還有行動派網友，想看什麼自己比較。

StabilityAI創始人翻出了Gemini 2.5 Flash的基準測試結果：

看後表示：

與Gemini 2.5 Flash競爭是多麼困難，Gemini 2.5 Flash成本比Mistral Medium 3低70%。
期待開源模型的發布，這是Mistral的關鍵優勢。

One More Thing

繼三月份推出Mistral Small、今日推出Mistral Medium後，Mistral AI透露接下來幾周正着手開發“大型”項目。

參考鏈接：
[1]https://mistral.ai/news/mistral-medium-3
[2]https://x.com/MistralAI/status/1920119463430500541
[3]https://techcrunch.com/2025/05/07/mistral-claims-its-newest-ai-model-delivers-leading-performance-for-the-price/

— 完 —

量子位 QbitAI · 頭條號簽約

關注我們，第一時間獲知前沿科技動態

科技

民航局出台攜“充電寶”乘機新規｜快訊 - 天天要聞

民航局出台攜“充電寶”乘機新規｜快訊

（王瀟雨攝影）文/王瀟雨在發生多起“充電寶”產品在航班飛行途中發生起火冒煙事件之後，中國民航局（下稱“民航局”）宣布將對旅客攜帶充電寶搭乘航班的要求出台了新的細則。按照民航局發布的緊急通知，從6月28日起，將“禁止旅客攜帶沒有3C標識、3C標識不清晰、被召回型號或批次的充電寶乘坐境內航班。”按照民航局的說...

06月26日 9283

來了來了！4換1交易達成！開拓者正式官宣楊瀚森 - 天天要聞

來了來了！4換1交易達成！開拓者正式官宣楊瀚森

開拓者官方發推歡迎楊瀚森，以及曬出了得到他的細節，如下：送給灰熊首輪第11順位選中的新秀錫德里克，換回首輪第16選秀權並選中楊瀚森，還有28年魔術首輪簽、27年老鷹次輪簽和28年國王次輪....

06月26日 7397

鴻蒙智能太香了！讓小藝智能體成為“效率外掛”，程序猿不做加班狗 - 天天要聞

鴻蒙智能太香了！讓小藝智能體成為“效率外掛”，程序猿不做加班狗

來源：科技海岸線每當說起程序員，大家腦海中都會浮現“996”的印象。隨着開發技術的全面進化，開發者的形象已經煥然一新了。

06月26日 1701

雷軍多次參與小米YU7路測：舒適性給我留下深刻印象 - 天天要聞

雷軍多次參與小米YU7路測：舒適性給我留下深刻印象

快科技6月26日消息，小米創辦人雷軍發文表示，我們高度重視質量，在小米YU7研發過程中，僅北京到上海的道路實測這個項目我就參與了兩次，1250公里的路程全程我自己開，早上六點出發，晚上九點、十點到。第一次是去年11月，YU7還帶着重偽裝，但舒適性和靜謐性給我留下了深刻的印象。第二次是今年2月，從北到南一路上非常冷，...

06月26日 9131

無視美媒質疑！開拓者總經理：我們對楊瀚森進行2年考察他的上限非常高 - 天天要聞

無視美媒質疑！開拓者總經理：我們對楊瀚森進行2年考察他的上限非常高

北京時間6月26日，NBA選秀大會，中國球員楊瀚森在首輪第16順位被開拓者選中，引發外界的熱議。此前，大部分的美國主流媒體預測當中，楊瀚森是排在首輪末尾端，以及次輪靠前的位置，最高也只有....

06月26日 3677

最高64核心128線程！龍芯3C6000系列處理器正式發布：性能可達至強8380 - 天天要聞

最高64核心128線程！龍芯3C6000系列處理器正式發布：性能可達至強8380

快科技6月26日消息，在今天的2025龍芯產品發布會暨用戶大會上，龍芯3C6000系列處理器正式發布，包括龍芯3C6000/S/D/Q等。龍芯3C6000基於LA664架構內核，六發射流水線，通用性能比上代成倍提高。單硅片擁有16核心32線

06月26日 1590

騰訊搜狗輸入法聯合騰訊混元，推出AI表情合成功能 - 天天要聞

騰訊搜狗輸入法聯合騰訊混元，推出AI表情合成功能

近日，搜狗輸入法版推出「AI合成表情」與「候選表情」兩大功能，以AI技術提升用戶社交溝通體驗，其中：「AI合成表情」基於騰訊混元大模型技術，用戶輸入文字描述或表情描述，便可毫秒級生成個性化表情包；「候選表情」：用戶在輸入常用文字時，候選區自動推薦高匹配度表情包，一鍵即可發送，告別手動翻找的繁瑣操作。...

06月26日 8970

小米首款小尺寸智能腕錶S4官宣：41mm+流沙金配色+多面體切割錶冠 - 天天要聞

小米首款小尺寸智能腕錶S4官宣：41mm+流沙金配色+多面體切割錶冠

今晚將要發布的小米真的是“高產”！多款新品整裝待發，紅米K80至尊版、紅米K Pad、小米MIX Flip2、小米YU7、小米AI眼鏡、小米開放式耳機Pro。還有一款智能穿戴設備，它就是小米首款小尺寸智能腕錶：小米Watch S4輕奢版。

06月26日 1159

機身輕至217克，再創紀錄的vivo X Fold5旗艦摺疊新品正式發布 - 天天要聞

機身輕至217克，再創紀錄的vivo X Fold5旗艦摺疊新品正式發布

6月25日，vivo正式發布新一代摺疊旗艦vivo X Fold5，機身輕至217克，打破了vivo上一代摺疊屏X Fold3保持的219克全球最輕紀錄。

06月26日 1585

企業=企業家？為何現在老闆喜歡做IP？ - 天天要聞

企業=企業家？為何現在老闆喜歡做IP？

今年上半年有一件很有趣的商業趣聞。海爾董事局主席、CEO周雲傑入駐短視頻平台。發布首個視頻後，就獲贊1.9萬，急速吸粉。這海爾CEO為何跑去發短視頻呢？這背後，其實是一種時代大勢所趨。現在，很多老闆紛紛做自媒體吸粉。

06月26日 1664