iPhone上也能跑Qwen3了!阿里一口气开源32款MLX模型

2025年06月17日18:12:03 科技 1635

“源神”千问,又一次闷声干大事!

今天刷 Reddit 才发现:昨晚,阿里千问一口气开源了 32 款,适配苹果 MLX 架构的 Qwen3 模型。

没错,32 款,就是这么量大实惠。

iPhone上也能跑Qwen3了!阿里一口气开源32款MLX模型 - 天天要闻

此前,千问已经陆续发布了 Qwen3 模型的 GGUF、AWQ、GPTQ 等多种量化格式,受到开发者广泛好评。

这些格式主要用于兼容开源部署工具(如 llama.cpp、lmdeploy 等),而MLX 是苹果自研的本地 AI 推理框架,专为 M 系芯片打造——能不能原生适配 MLX,决定了 Qwen3 能不能“跑进苹果设备的底层”。

这次,干脆一口气全配齐了搭配苹果MLX的模型:每款模型都有4bit、6bit、8bit 和 BF16 等 4 种不同精度的量化版本。

iPhone上也能跑Qwen3了!阿里一口气开源32款MLX模型 - 天天要闻

最炸的消息是:iPhone 上跑千问,终于不是幻想了!

千问官方表示:

“现在,从 Mac Pro、Mac Studio 到 Mac mini、MacBook,再到 iPad,甚至内存更小的设备如 iPhone,都能轻松部署 Qwen3,真正做到全场景覆盖。”

而更值得注意的是:这是开源大模型首次系统性“杀入 Apple 端侧 AI 生态”,甚至被媒体一致解读为——Apple Intelligence 在中国落地的前奏。

Qwen3 的这一动作不仅收获了X上网友的好评,还被 MLX 框架的核心开发者 Vaibhav Srivastav 点赞。他在评论区写道:

祝贺你们的量化模型!你们把 MLX 放在优先级很高的位置,真的很棒!

iPhone上也能跑Qwen3了!阿里一口气开源32款MLX模型 - 天天要闻

虽然 Apple Intelligence 和 Siri 的中国上线一再跳票,令人失望,但这次——中国开源之神 + 苹果硬件霸主,终于有了正面交汇的一刻。

1.Qwen3 开源了什么?哪些设备能用?

Qwen3 成为苹果 Apple Intelligence 在中国市场的“本地模型供应商”,如今进一步全面适配 MLX,其实并不令人意外。

MLX 是一个开源的机器学习框架,专为苹果芯片深度适配。MLX 框架充分利用 Apple Silicon 的神经引擎和统一内存系统,兼容 PyTorch/Numpy 风格 API,可高效执行大模型,被越来越多的 AI 开发者采用。

从 Hugging Face 的 Qwen3-MLX 模型页来看,阿里这次开源的模型覆盖了从 0.6B 到 235B 的完整参数量级,而且每个模型都提供 4bit、6bit、8bit 和 BF16 四种不同精度版本,开发者可以根据设备性能自由选择。

地址:https://huggingface.co/collections/Qwen/qwen3-67dd247413f0e2e4f653967f

iPhone上也能跑Qwen3了!阿里一口气开源32款MLX模型 - 天天要闻

iPhone上也能跑Qwen3了!阿里一口气开源32款MLX模型 - 天天要闻

不同设备推荐部署范围如下:

  • 高端:Mac Pro、Mac Studio → 推荐运行 32B、235B
  • 主流:MacBook Pro/Air(16G/32G)→ 推荐 8B、14B
  • 轻量:iPad、iPhone(A17/M芯片)→ 可运行 0.6B / 1.7B 级模型,适合本地小推理

不过,根据 Reddit 上网友实测,即便是配备 128GB 内存的 Mac Studio,在运行 Qwen3‑235B 的 4bit 版本时依然存在内存瓶颈。

有用户吐槽说:

“可惜 Mac 用户即使有 128GB RAM,也无法运行 Qwen3 的 235B 模型的 4bit 版本。只差 3% 的内存。”

iPhone上也能跑Qwen3了!阿里一口气开源32款MLX模型 - 天天要闻

这也说明,即使 MLX 是苹果原生优化的推理框架,对于参数量巨大的 MoE 模型(如 Qwen3‑235B)而言,设备硬件依然是决定上限的关键。

iPhone上也能跑Qwen3了!阿里一口气开源32款MLX模型 - 天天要闻

2.Mac以前也能跑Qwen,为什么官方支持更值得关注?

在Qwen3官宣支持苹果 MLX 框架之前,你肯定也刷到过在Mac上跑Qwen的各种实测,或者亲自上手过。

这是因为此前社区已经通过第三方量化格式(如 GGUF、GPTQ)+ 推理框架(如 llama.cpp、llm.cpp、lmdeploy),实现了在 Mac 上加载 Qwen 模型的方式。

但这次官方 MLX 支持,仍然引发了 Reddit 上不少开发者的兴奋情绪:

用户 Ok-Pipe-5151 表示:“这是 Mac 用户的重大利好!官方支持来了,非常兴奋。”

另一位用户问:“这些模型不是早就通过第三方量化可以用了?”

他回复道:

“是的,但官方支持更好。”

iPhone上也能跑Qwen3了!阿里一口气开源32款MLX模型 - 天天要闻

“官方适配 MLX” 到底比第三方支持强在哪里,具体点来说有这几点:

  • 免去格式转换、参数调整、推理配置等繁琐步骤,开箱即用
  • 兼容 MLX 原生调度机制,在 Apple Silicon 芯片上可充分调用神经引擎与统一内存架构,运行效率更高
  • 模型结构与量化过程由官方调优,在推理稳定性、精度保持率上通常优于第三方版本
  • 长期可维护性更好,未来随着苹果系统/MLX 更新,官方适配模型能更快同步迭代

举个栗子:过去,很多用户要在 iOS 上跑模型,得靠 MNN 等轻量框架,整个流程包括自己编译 framework、签名打包、配置依赖,非常麻烦。

iPhone上也能跑Qwen3了!阿里一口气开源32款MLX模型 - 天天要闻

上图:此前,千问给的官方教程

而现在,得益于 MLX 的官方适配,Qwen3 终于能“跳过这套链路”,直接以苹果原生方式部署推理。

3.写在最后:苹果智能在中国的落地进入倒计时阶段?

苹果刚在本周一发布了 iOS 18.6 开发者测试版,但仍未就中国区上线 Apple Intelligence 给出时间表。

不过,阿里巴巴此次对 Qwen3 的 MLX 深度适配,被广泛解读为是为国行版 Apple Intelligence 打基础、铺路径。

此前,就有多家媒体报道称,苹果原计划在 iOS 18.5 或 18.6 中上线 Apple Intelligence,技术上已基本就绪,但由于本地的合规流程尚未完全走通,正式上线时间一再延后。

与此同时,值得特别关注的是:苹果官方已确认,全新的 deep LLM Siri 将随 iOS 26.4 于 2026 年春季正式推出。这意味着,一个真正具备对话理解能力、支持本地大模型推理的 Siri 正在缓步走来。

随着千问在开源上的知名度不断攀升,更多的人对国行苹果智能拥有信心。而千问本身也因此从“技术力”的象征,逐步走向“生态级别”的落地合作。

你认为国行 Apple Intelligence 会赶在 2025 年底前上线吗?

科技分类资讯推荐

从领先到落后:英特尔正经历“寒冬” - 天天要闻

从领先到落后:英特尔正经历“寒冬”

【环球网科技综合报道】7月11日,据外媒报道,英特尔首席执行官陈立武近日在发表内部讲话时直言英特尔已不再是领先芯片制造商,甚至不在前十。其市值如今仅约1000亿美元,与18个月前相比大幅缩水,而英伟达市值却一度突破4万亿美元,形成鲜明对比。“二三十年前,我们确实是行业领导者。可如今的世界已经变了,我们已不在全...
“中国太酷了”!硬核实力圈粉世界 - 天天要闻

“中国太酷了”!硬核实力圈粉世界

日前举行的国新办新闻发布会上,有记者提到,随着大量海外博主分享来华见闻,“中国变酷了”的印象被越来越多全球网友所认同。对此,国家发展改革委主任郑栅洁表示,这背后反映了中国的综合国力。中国变酷了!酷在哪里?
华为Pura 80 Ultra国际版亮相:系统开机是EMUI 15.0,电池容量为5170mAh - 天天要闻

华为Pura 80 Ultra国际版亮相:系统开机是EMUI 15.0,电池容量为5170mAh

当地时间7月10日,华为在迪拜推出全新的Pura 80 Ultra影像旗舰,售价是5099阿联酋迪拉姆,约合人民币9961元。对比国行版,Pura 80 Ultra国际版有两大变化,一是系统调整为EMUI 15.0,国行版系统是鸿蒙5.1,二是电池容量为5170mAh,国行版电池容量是5700mAh。来源 江南都市报、快科技编辑 贾凯 审核 蒋波 陈洁...
AMD下代桌面锐龙处理器:N2工艺、Zen6架构、更多内核、依旧AM5插槽 - 天天要闻

AMD下代桌面锐龙处理器:N2工艺、Zen6架构、更多内核、依旧AM5插槽

有关于AMD下代桌面端锐龙处理器的更多信息浮出水面。AMD下代桌面端锐龙处理器代号“Medusa Ridge”,将采用全新的Zen6架构,该架构将使用TSMC的N2(2nm)工艺节点构建CCD,相比于前代Zen5架构的台积电N4P工艺节点,N2工艺的晶体管密度将显著提升。此前单CCD的最大核心数量为8个,而在Medusa Ridge上AMD可能会将单个CCD
AI终结传统软件业,如同互联网终结传统媒体 - 天天要闻

AI终结传统软件业,如同互联网终结传统媒体

AI编程工具正推动软件行业走向“峰值时刻”。近日,芯片金融分析公司Fabricated Knowledge的创始人Doug O'Laughlin发表文章称,生成式AI正以类似互联网颠覆传统媒体的方式,重塑软件行业的格局。文章指出,AI工具,比如Cursor和Claude Code,正在让编写代码的成本和时间大幅下降,过去需要每token数千美元才能完成的开发
英特尔CEO陈立武坦言:公司已跌出半导体行业前十 - 天天要闻

英特尔CEO陈立武坦言:公司已跌出半导体行业前十

【TechWeb】7月11日消息,据外媒报道,英特尔CEO陈立武在内部讲话中坦言,公司已跌出半导体行业前十。陈立武表示,20到30年前,英特尔确实是领导者,世界已经发生了变化。我们现在已经不是排名前十的半导体公司了。有报道称,英特尔公司发言人后续解释称其所指为 "市值" 而非技术。在过去的 18 个月里,英特尔的市值从 202...
华为海思Cat.1物联芯片Hi2131正式上市 - 天天要闻

华为海思Cat.1物联芯片Hi2131正式上市

7月10日,华为海思正式宣布,Hi2131 Cat.1物联芯片正式上市。据介绍,Hi2131 Cat.1 芯片采用超轻量芯片架构与极简休眠管理,将休眠功耗一举压缩至 150uA。相较于常见的同类型芯片,保活功耗直降 30% 以上,数传功耗亦降低 10%。功耗的显著优化直接转化为设备续航能力的跃升。这意味着共享设备维护周期大幅延长,用户体验与...