1/8成本比肩Claude 3.7,Mistral Medium 3来了

2025年05月08日12:54:02 科技 1962

西风 发自 凹非寺

量子位 | 公众号 QbitAI

用1/8成本比肩Claude 3.7,刚刚,“欧洲OpenAI”Mistral AI发布多模态新模型。

Mistral Medium 3,主打编程和多模态理解,且在性能和成本间进行了平衡。

1/8成本比肩Claude 3.7,Mistral Medium 3来了 - 天天要闻

官方称,在各类基准测试中,Mistral Medium 3性能达到或超越Claude Sonnet 3.7的90%,且成本大大降低。

Claude 3.7 Sonnet的价格为每百万输入token 3美元,每百万输出token 15美元,而Mistral Medium 3:

每百万输入token仅0.4美元,每百万输出token 2美元

整体性能,不管是和领先开源模型Llama 4 Maverick还是和企业级模型Cohere Command A相比,Mistral Medium 3都能打得有来有回。

目前,Mistral Medium 3 API已在Mistral La Plateforme和Amazon Sagemaker上线,不久后还将在IBM WatsonX、NVIDIA NIM、Azure AI Foundry和Google Cloud Vertex上推出。

具备一系列企业级能力

下面具体来看看基准测试。

Mistral Medium 3在编程和STEM任务中尤为突出。

1/8成本比肩Claude 3.7,Mistral Medium 3来了 - 天天要闻

官方原话是“其性能甚至接近非常大且运行速度慢得多的竞争对手”。

不过呢,既不开放模型权重,也没有透露模型大小……

1/8成本比肩Claude 3.7,Mistral Medium 3来了 - 天天要闻

另外,Mistral AI还发布了第三方人类评估。

人类评估中,Mistral Medium 3依旧是在编程方面占优势。

1/8成本比肩Claude 3.7,Mistral Medium 3来了 - 天天要闻

在多模态和其他人语言任务中,相比Llama 4 Maverick,Mistral Medium 3的表现也占上风。

1/8成本比肩Claude 3.7,Mistral Medium 3来了 - 天天要闻

除了测试数据之外,官方还特别强调了其适应企业环境的能力,包括:

  • 混合部署或本地 / 虚拟私有云(VPC)内部署
  • 定制化后期训练
  • 与企业工具和系统集成

企业可以轻松将智能全面集成到系统中,借助Mistral的应用AI解决方案,该模型可以持续进行预训练、全面微调,并融入企业知识库,使其成为针对特定领域训练、持续学习和自适应工作流程的高保真解决方案。

官方称,金融服务、能源和医疗保健领域的客户正在使用该模型测试,通过深入的背景信息来丰富客户服务、实现业务流程的个性化,并对复杂的数据集进行分析。

1/8成本比肩Claude 3.7,Mistral Medium 3来了 - 天天要闻

另外,他们还推出了Le Chat Enterprise,这是一项面向企业的聊天机器人服务,提供了AI Agent建造器之类的工具,并将Mistral的模型与Gmail、Google Drive、SharePoint等第三方服务集成。

据了解,Le Chat Enterprise将很快支持 MCP。

Mistral Medium 3发布后引发大批网友关注,有网友为其“高性价比”点赞。

1/8成本比肩Claude 3.7,Mistral Medium 3来了 - 天天要闻

不过也有不少网友吐槽模型没说开源结果又高调地和开源模型比较,有点奇怪。

1/8成本比肩Claude 3.7,Mistral Medium 3来了 - 天天要闻

还有行动派网友,想看什么自己比较。

StabilityAI创始人翻出了Gemini 2.5 Flash的基准测试结果:

1/8成本比肩Claude 3.7,Mistral Medium 3来了 - 天天要闻

看后表示:

与Gemini 2.5 Flash竞争是多么困难,Gemini 2.5 Flash成本比Mistral Medium 3低70%。

期待开源模型的发布,这是Mistral的关键优势。

1/8成本比肩Claude 3.7,Mistral Medium 3来了 - 天天要闻

One More Thing

继三月份推出Mistral Small、今日推出Mistral Medium后,Mistral AI透露接下来几周正着手开发“大型”项目。

1/8成本比肩Claude 3.7,Mistral Medium 3来了 - 天天要闻

参考链接:
[1]https://mistral.ai/news/mistral-medium-3
[2]https://x.com/MistralAI/status/1920119463430500541
[3]https://techcrunch.com/2025/05/07/mistral-claims-its-newest-ai-model-delivers-leading-performance-for-the-price/

— 完 —

量子位 QbitAI · 头条号签约

关注我们,第一时间获知前沿科技动态

科技分类资讯推荐

一键批量解绑APP账号!中国联通“二次号码焕新”服务正式上线 - 天天要闻

一键批量解绑APP账号!中国联通“二次号码焕新”服务正式上线

快科技5月8日消息,如今大量手机APP都与手机账号强绑定,带来很多便捷的同时,也让“二次号码”的用户非常苦恼。“二次号码”也就是运营商回收后重新启用号码,以往经常有用户遇到无法注册使用互联网应用或登录到前任机主账号等问题,甚至还会出现频繁收到前任机主的验证码、电话。为了应对这种情况,工信部指导基础电信企...
72888元!徕卡发布M11-P Safari特别版相机:精致如艺术品 - 天天要闻

72888元!徕卡发布M11-P Safari特别版相机:精致如艺术品

快科技5月8日消息,今日,徕卡正式发布了M11 - P Safari特别版相机,其售价为72888元。这款相机在外观设计上独具匠心。它采用了经典的橄榄绿配色,以人造革材质进行橄榄绿覆皮,顶盖则采用同色哑光漆面,营造出一种复古而神秘的氛围。尤为引人注目的是,它用银色螺丝取代了经典的“可乐标”,给人一种新颖又不失格调的视觉...
曝三星S25系列增产80万台 由250万台上调至330万台 - 天天要闻

曝三星S25系列增产80万台 由250万台上调至330万台

【CNMO科技消息】据外媒报道,三星正在加快提升旗舰手机的产量,以应对当前市场环境中的不确定性。韩国媒体透露,三星计划在5月份额外生产80万台Galaxy S25系列手机,这一举动很可能是为了在关税政策变动前尽可能多地将产品送入美国市场。 根据消息,三星已通知其零部件供应商,将在本月内生产共计1620万台手机和平板设备,...
京东全球招人!薪酬不设上限 - 天天要闻

京东全球招人!薪酬不设上限

5月8日,“京东招聘”微信公众号发布消息,宣布“京东TGT—顶尖青年技术天才计划”全球启动。据介绍,该计划面向全球高校本硕博在校生、应届生及毕业两年内的技术人才开放招募,旨在与全球技术天才一起,基于京东丰富的业务场景探索前沿技术、用技术创造更多美好。在人才培养方面,京东表示将采取“技术导师+业务导师+成长...
小米太难了?紧急撤回更新或许只是开始 - 天天要闻

小米太难了?紧急撤回更新或许只是开始

话说从上次意外发生至今,小米汽车一直处在风口浪尖。近日,小米汽车又发布《关于大家关心问题的回答》,谈到了最近争议的限制马力和碳纤维双风道前舱盖。其中,关于限制马力的更新说道,已暂停了这次推送。至于已升级的少量用户,小米汽车将会在下个版本更新