4张H20可跑Qwen3满血 阿里为AI“双子星”战略砸下3800亿

2025年05月17日07:30:31 财经 7196
4张H20可跑Qwen3满血 阿里为AI“双子星”战略砸下3800亿 - 天天要闻

阿里祭出AI“双子星”狙击大厂围城

作者/ IT时报记者 毛宇

编辑/ 孙妍

4月29日凌晨,阿里巴巴旗下通义千问团队正式发布并开源新一代模型Qwen3。此次发布的Qwen3系列涵盖了多个模型类型,包括2款参数规模为30B和235B的混合专家(MoE)模型,以及6款参数从0.6B到32B的密集模型。

作为国内首个混合推理模型家族,一经推出便迅速引发开源圈的激烈讨论:Qwen3能否成为下一个DeepSeek?

发布后不久,华为计算官方发文称,升腾MindSpeed和MindIE一直以来同步支持Qwen系列模型,此次Qwen3系列开源后,已在MindSpeed和MindIE中实现开箱即用,完成了Qwen3的0Day适配。海光信息方面也表示,其DCU迅速完成对全部8款模型的无缝适配与调优。

“发布第二天,我们已经完成了本地化部署Qwen3-30B-A3B,用了单卡4090,目前对C端用户开放。”共绩算力COO王鹏告诉《IT时报》记者,目前Qwen3部署成本较低,Qwen3-235B-A22B只需要4张H20,而其小模型的部署成本则更低。亦有算力集群公司的工作人员告诉记者,Qwen3发布第二天已接到客户订单。

成本较DeepSeek大幅下降 仍未解决幻觉问题

与此前的模型相比,Qwen3有着明显提升。

在架构上,Qwen3采用混合专家(MoE)架构,以旗舰模型Qwen3-235B-A22B为例,总参数量高达235B,但激活仅需22B,大大降低了运行时对算力的即时需求。

这一设计使得模型在面对不同复杂程度的任务时,能够灵活调配计算资源,针对简单问题快速响应,复杂问题深度思考,实现“快思考”与“慢思考”的结合,兼顾效率与准确性,为模型应用开拓了更广阔的空间,有望改变行业对模型应用场景适配的传统思路。

4张H20可跑Qwen3满血 阿里为AI“双子星”战略砸下3800亿 - 天天要闻

预训练数据量的提升也是Qwen3的一大亮点。官方数据显示,其数据量跃升至36T,是Qwen2.5的三倍之多。多轮强化学习的运用,将非思考模式巧妙融入思考模型,优化了模型的智能处理逻辑,进一步提升了模型在推理、指令遵循、工具调用以及多语言能力等方面的表现。

与DeepSeek-R1相比,Qwen3参数量仅为其1/3,成本大幅下降。在部署方面,仅需4张H20即可部署Qwen3满血版,显存占用仅为性能相近模型的三分之一。“这对于中小企业和个人开发者而言,极大降低了使用高性能模型的成本门槛和部署时间。”王鹏表示。

但也有不少AI发烧友实测后在社交平台上指出,Qwen3在长文本能力上的表现并不算突出,有一定幻觉率,但在生成复杂代码、数学推理等方面,思考模式的表现明显好于非思考模式。《IT时报》记者使用Qwen3网页版尝试生成关于“去年五一小长假旅游数据与景区特性关联”的报告,Qwen3“普通”模式未能给出准确数据支持,出现了较高的幻觉率,但在“深度思考”模式下,幻觉率大幅降低,数据更加准确。

祭出AI“双子星”战略 阿里迫切想在C端站稳脚跟

在当下AI赛道,科技巨头们的每一步落子都备受瞩目。

近期,一则有关算力抢购的传闻甚嚣尘上,传言腾讯、阿里、字节跳动纷纷下场,重金争抢GPU算力资源。虽然字节跳动已出面辟谣,称相关信息不实,但这一传闻本身,足以反映科技大厂对AI战略布局的重视与急切。

作为AI发展的根基,算力的重要性不言而喻。阿里此前更是公开表态,未来三年将投入超3800亿元用于云和AI硬件基础设施建设。

当前,阿里集团各个业务板块将AI作为重要KPI,从阿里的整体AI战略布局来看,对AI的投入持续加大,试图强化通义千问与夸克的“双子星”格局。通义千问专注于支撑云上智能,夸克则着力打造端侧入口,协同推动阿里AI To C战略的落地。

与此前最大的不同是,“夸克”和“通义”成为Qwen3的主要体验入口,这两大App所有用户均可免费使用这一最新的开源模型。

4张H20可跑Qwen3满血 阿里为AI“双子星”战略砸下3800亿 - 天天要闻

“通义App在C端并没有打出声量,只能委以夸克重任。”一位阿里内部人士曾对《IT时报》记者表示。

通义千问凭借在多模态处理和复杂任务推理方面的技术优势,曾为阿里的B端企业服务及开发者生态提供了有力支撑。诸如飞猪旅行借助通义千问多模态模型,实现了用户方言语音规划行程的功能;Rokid AR眼镜搭载其技术后,能够进行实时翻译。通义千问在大模型开源上跑得很快,但是,其“通义”App在C端应用上并没有使出“撒手锏”。

反倒是夸克突破重围,第三方数据显示,2025年3月,夸克的MAU(月活跃人数)达到1.48亿,登上国内AI应用榜首。

2024年底至2025年初,阿里通过一系列组织架构调整和人才布局推进AI To C战略,将AI应用“通义”并入智能信息事业群,整合天猫精灵与夸克团队,并聘请顶尖AI科学家许主洪负责AI To C业务研发。

阿里AI战略仍有诸多挑战横亘在前。通义千问在维持技术优势的同时,如何进一步降低使用门槛,满足中小企业多样化的定制需求,成为亟待解决的难题。其API(应用程序编程接口)价格虽具备一定竞争力,但部分中小企业在技术对接与模型二次开发方面,仍面临诸多困难。夸克同样面临挑战,随着用户数量的快速增长,体验稀释问题逐渐凸显,部分功能在流量增加时响应速度变慢,这就要求夸克必须优化技术架构与服务器性能,以确保用户体验的稳定性。

AI市场竞争激烈,腾讯的混元大模型依托微信庞大的用户基础和生态优势,在微信多个入口为元宝争取亮相的机会,对C端用户形成“茧房式包裹”。字节跳动旗下的豆包借助旗下抖音的推流优势,在2024年11月MAU飙升至5998万,几乎长期霸榜AI应用下载量榜单前三。

虽然手握通义和夸克“双子星”,一条腿迈进开源圈,一条腿迈向C端用户,但在巨头环伺下,阿里AI战略的前路仍充满变数。

排版/ 季嘉颖

图片/ 通义 东方IC

来源/《IT时报》公众号vittimes

E N D

财经分类资讯推荐

金价暴跌!金饰价格全线跌破1000元 - 天天要闻

金价暴跌!金饰价格全线跌破1000元

16日国际油价上涨全周累计上涨超2%原油期货市场方面,交易员们仍在关注美伊核谈判的最新进展。有消息人士称,谈判双方仍有一些问题亟待解决。这一消息部分缓解了市场对于原油供应可能增加的担忧情绪,国际油价周五止跌反弹,美油期货和布油期货主力合约价
八百块的鸿蒙新机,华为和苹果这一刻合体! - 天天要闻

八百块的鸿蒙新机,华为和苹果这一刻合体!

如果是老机友,应该对华为手机这几年的艰辛历程不陌生。在2019年中,华为突然遭到了来自美国的极限打压,这种打压是硬件和软件两方面的,不仅迅速的断掉了原本已经逐渐和高通处理器追平的麒麟处理器,让麒麟9000成为"绝唱",系统上也不再授权GMS
中国国际证券战略入股极度证券,开启全球市场数字化布局新时代 - 天天要闻

中国国际证券战略入股极度证券,开启全球市场数字化布局新时代

(2025 年 5 月 16日,香港)中国国际证券(CIS)今日宣布完成对全球领先金融科技平台极度证券(JD Trader)的战略投资(控股比例约55%),此次合作将整合双方在传统金融与金融科技领域的优势,构建覆盖AI、大数据、区块链、云计算等技术运用的金融交易生态,标志着中国国际证券在全球化与数字化战略上迈出关键一步。 强强...
这一巨头突发!股价已大跌近60%… - 天天要闻

这一巨头突发!股价已大跌近60%…

当地时间周五,美国总统特朗普表示,美国可能在“未来两到三周内”单方面向多个贸易伙伴发送函件,确定新的关税税率,以取代正式贸易谈判。这一表态使投资者期待关税政策尽快明朗化。此外,在消化了近两天公布的多项经济数据后,市场预期今年美联储还将降息两
天价离婚!她分走近3亿元 - 天天要闻

天价离婚!她分走近3亿元

5月16日,金圆股份披露其实际控制人之一离婚财产分割的最新进展,赵辉已将其直接持有的8.505%公司股份转让给前妻潘颖。如按5月16日4.34元/股的收盘价测算,目前潘颖已获得的股份对应市值约2.87亿元。
10户中央企业11名领导人员职务任免 - 天天要闻

10户中央企业11名领导人员职务任免

国资委网站截图中国物流集团有限公司、中国电气装备集团有限公司徐鸿任中国物流集团有限公司党委副书记、董事,提名为中国物流集团有限公司总经理人选;免去其中国电气装备集团有限公司党委常委职务,不再担任中国电气装备集团有限公司总会计师职务。钟吉昌任
昨夜!美股突然拉升,中概股多数上涨! - 天天要闻

昨夜!美股突然拉升,中概股多数上涨!

隔夜美股盘中拉升,全线收涨。中概股多数上涨。国际金价再度下跌。美股拉升收涨周五美股三大指数集体收涨,道指涨0.78%,本周累涨3.41%;标普500指数涨0.7%,本周累涨5.27%;纳指涨0.52%,本周累涨7.15%。大型科技股多数上涨,特斯拉涨超2%,奈飞、谷歌涨超1%,微软、英伟达、亚马逊、英特尔小幅上涨。热门中概股多数上涨,...