4张H20可跑Qwen3满血 阿里为AI“双子星”战略砸下3800亿

2025年05月17日07:30:31 财经 7196
4张H20可跑Qwen3满血 阿里为AI“双子星”战略砸下3800亿 - 天天要闻

阿里祭出AI“双子星”狙击大厂围城

作者/ IT时报记者 毛宇

编辑/ 孙妍

4月29日凌晨,阿里巴巴旗下通义千问团队正式发布并开源新一代模型Qwen3。此次发布的Qwen3系列涵盖了多个模型类型,包括2款参数规模为30B和235B的混合专家(MoE)模型,以及6款参数从0.6B到32B的密集模型。

作为国内首个混合推理模型家族,一经推出便迅速引发开源圈的激烈讨论:Qwen3能否成为下一个DeepSeek?

发布后不久,华为计算官方发文称,升腾MindSpeed和MindIE一直以来同步支持Qwen系列模型,此次Qwen3系列开源后,已在MindSpeed和MindIE中实现开箱即用,完成了Qwen3的0Day适配。海光信息方面也表示,其DCU迅速完成对全部8款模型的无缝适配与调优。

“发布第二天,我们已经完成了本地化部署Qwen3-30B-A3B,用了单卡4090,目前对C端用户开放。”共绩算力COO王鹏告诉《IT时报》记者,目前Qwen3部署成本较低,Qwen3-235B-A22B只需要4张H20,而其小模型的部署成本则更低。亦有算力集群公司的工作人员告诉记者,Qwen3发布第二天已接到客户订单。

成本较DeepSeek大幅下降 仍未解决幻觉问题

与此前的模型相比,Qwen3有着明显提升。

在架构上,Qwen3采用混合专家(MoE)架构,以旗舰模型Qwen3-235B-A22B为例,总参数量高达235B,但激活仅需22B,大大降低了运行时对算力的即时需求。

这一设计使得模型在面对不同复杂程度的任务时,能够灵活调配计算资源,针对简单问题快速响应,复杂问题深度思考,实现“快思考”与“慢思考”的结合,兼顾效率与准确性,为模型应用开拓了更广阔的空间,有望改变行业对模型应用场景适配的传统思路。

4张H20可跑Qwen3满血 阿里为AI“双子星”战略砸下3800亿 - 天天要闻

预训练数据量的提升也是Qwen3的一大亮点。官方数据显示,其数据量跃升至36T,是Qwen2.5的三倍之多。多轮强化学习的运用,将非思考模式巧妙融入思考模型,优化了模型的智能处理逻辑,进一步提升了模型在推理、指令遵循、工具调用以及多语言能力等方面的表现。

与DeepSeek-R1相比,Qwen3参数量仅为其1/3,成本大幅下降。在部署方面,仅需4张H20即可部署Qwen3满血版,显存占用仅为性能相近模型的三分之一。“这对于中小企业和个人开发者而言,极大降低了使用高性能模型的成本门槛和部署时间。”王鹏表示。

但也有不少AI发烧友实测后在社交平台上指出,Qwen3在长文本能力上的表现并不算突出,有一定幻觉率,但在生成复杂代码、数学推理等方面,思考模式的表现明显好于非思考模式。《IT时报》记者使用Qwen3网页版尝试生成关于“去年五一小长假旅游数据与景区特性关联”的报告,Qwen3“普通”模式未能给出准确数据支持,出现了较高的幻觉率,但在“深度思考”模式下,幻觉率大幅降低,数据更加准确。

祭出AI“双子星”战略 阿里迫切想在C端站稳脚跟

在当下AI赛道,科技巨头们的每一步落子都备受瞩目。

近期,一则有关算力抢购的传闻甚嚣尘上,传言腾讯、阿里、字节跳动纷纷下场,重金争抢GPU算力资源。虽然字节跳动已出面辟谣,称相关信息不实,但这一传闻本身,足以反映科技大厂对AI战略布局的重视与急切。

作为AI发展的根基,算力的重要性不言而喻。阿里此前更是公开表态,未来三年将投入超3800亿元用于云和AI硬件基础设施建设。

当前,阿里集团各个业务板块将AI作为重要KPI,从阿里的整体AI战略布局来看,对AI的投入持续加大,试图强化通义千问与夸克的“双子星”格局。通义千问专注于支撑云上智能,夸克则着力打造端侧入口,协同推动阿里AI To C战略的落地。

与此前最大的不同是,“夸克”和“通义”成为Qwen3的主要体验入口,这两大App所有用户均可免费使用这一最新的开源模型。

4张H20可跑Qwen3满血 阿里为AI“双子星”战略砸下3800亿 - 天天要闻

“通义App在C端并没有打出声量,只能委以夸克重任。”一位阿里内部人士曾对《IT时报》记者表示。

通义千问凭借在多模态处理和复杂任务推理方面的技术优势,曾为阿里的B端企业服务及开发者生态提供了有力支撑。诸如飞猪旅行借助通义千问多模态模型,实现了用户方言语音规划行程的功能;Rokid AR眼镜搭载其技术后,能够进行实时翻译。通义千问在大模型开源上跑得很快,但是,其“通义”App在C端应用上并没有使出“撒手锏”。

反倒是夸克突破重围,第三方数据显示,2025年3月,夸克的MAU(月活跃人数)达到1.48亿,登上国内AI应用榜首。

2024年底至2025年初,阿里通过一系列组织架构调整和人才布局推进AI To C战略,将AI应用“通义”并入智能信息事业群,整合天猫精灵与夸克团队,并聘请顶尖AI科学家许主洪负责AI To C业务研发。

阿里AI战略仍有诸多挑战横亘在前。通义千问在维持技术优势的同时,如何进一步降低使用门槛,满足中小企业多样化的定制需求,成为亟待解决的难题。其API(应用程序编程接口)价格虽具备一定竞争力,但部分中小企业在技术对接与模型二次开发方面,仍面临诸多困难。夸克同样面临挑战,随着用户数量的快速增长,体验稀释问题逐渐凸显,部分功能在流量增加时响应速度变慢,这就要求夸克必须优化技术架构与服务器性能,以确保用户体验的稳定性。

AI市场竞争激烈,腾讯的混元大模型依托微信庞大的用户基础和生态优势,在微信多个入口为元宝争取亮相的机会,对C端用户形成“茧房式包裹”。字节跳动旗下的豆包借助旗下抖音的推流优势,在2024年11月MAU飙升至5998万,几乎长期霸榜AI应用下载量榜单前三。

虽然手握通义和夸克“双子星”,一条腿迈进开源圈,一条腿迈向C端用户,但在巨头环伺下,阿里AI战略的前路仍充满变数。

排版/ 季嘉颖

图片/ 通义 东方IC

来源/《IT时报》公众号vittimes

E N D

财经分类资讯推荐

如果全球金融危机重演,普通人如何保住钱袋子? - 天天要闻

如果全球金融危机重演,普通人如何保住钱袋子?

你有没有想过,万一未来的某一天,全球性金融危机再度上演,普通人如何保住钱袋子,避免财富被无情收割?也许你的第一反应是“乱世买黄金”,但历史上每一次全球性金融危机,从来不是突然降临,而是存在三个不同的危机阶段,现金、黄金、债券、股票各自扮演的
华为云CloudDevice云终端技术标准深度拆解:将迎哪些变革? - 天天要闻

华为云CloudDevice云终端技术标准深度拆解:将迎哪些变革?

当AI大模型开始像水电一样渗透进生活每个角落,当5G-A网络将端到端时延压缩至毫秒级,云终端产业正处在一场前所未有的变革前夜。从手机到车机,从Pad到工业机器人,越来越多的设备正在摆脱硬件算力的桎梏,试图通过“一跳入云”实现能力跃升。
广州市湾区国际重组中心亮相第14届金交会,构建企业纾困新平台 - 天天要闻

广州市湾区国际重组中心亮相第14届金交会,构建企业纾困新平台

6月26日,第14届中国(广州)国际金融交易·博览会在广州开幕。开幕式上,广州交易集团旗下大湾区特殊资产赋能服务平台联合粤港澳大湾区内破产管理人协会、资产管理协会、资产管理公司等单位组建的广州市湾区国际重组中心正式揭牌,标志着广州在企业纾困与金融风险化解领域迈出关键一步。广东特殊资产赋能服务平台有限公司...
2025年618大家电:增长有迹,丰收未满的市场侧写 - 天天要闻

2025年618大家电:增长有迹,丰收未满的市场侧写

2025 年 “6 18” 大促期间,行业呈现 “长周期促销 + 玩法简化” 特点,国补与平台补贴双重驱动下,产品均价创下新低。在此背景下,龙头企业主动出击,价格战愈演愈烈,这一局面或将使企业陷入亏损,还会让部分企业面临高库存难题,行业迫切
穿隧跨江、桥隧比超92%!渝厦高铁如何啃下“硬骨头”? - 天天要闻

穿隧跨江、桥隧比超92%!渝厦高铁如何啃下“硬骨头”?

新重庆-重庆日报 记者 杨永芹跨高桥、穿长隧、破乌江天险……6月27日,记者从渝黔铁路有限责任公司获悉,渝厦高铁重庆东-黔江段新建正线长度约242公里,桥隧比超92%。渝厦高铁重庆段进入联调联试阶段,图为57661次检测车对线路进行调试。
疯了吗?连亏两年,从70跌到4块,摩根士丹利却重仓买进十大股东 - 天天要闻

疯了吗?连亏两年,从70跌到4块,摩根士丹利却重仓买进十大股东

前两年外资一般都喜欢买白马股,蓝筹股,现在这两年彻底变了,也学起了国内的游资和牛散,风格开始倾向于买题材股,甚至亏损股了,因为这些国际投行在A股经过一番毒打后,发现业绩好的白马股,蓝筹股,不但很难挣钱,甚至会深度套牢。今天复盘发现一只固态电
最强物流枢纽,来自中西部 - 天天要闻

最强物流枢纽,来自中西部

本文来源:时代周报 作者:李杭从“三日达”“次日达”再到“当日小时达”,快递越“跑”越快的背后,是我国物流网络的不断完善与升级。近日,国家发改委印发通知,将30个国家物流枢纽纳入新一批建设名单,至此国家物流枢纽总数增至181个。
中方警告全球:不允许配合!美媒直言:中国已到超越的“分水岭” - 天天要闻

中方警告全球:不允许配合!美媒直言:中国已到超越的“分水岭”

这一禁令不仅针对美国国内企业,还妄图让全世界的企业都遵守,其目的是形成针对中国科技发展的“封锁墙”,阻断华为等中国企业的芯片供应链,进而压制中国高科技产业的发展。美国的这一做法,是其惯用的贸易保护主义手段,试图凭借自身在国际经济体系中的影响力,遏制中国科技的崛