
阿里祭出AI“雙子星”狙擊大廠圍城
作者/ IT時報記者 毛宇
編輯/ 孫妍
4月29日凌晨,阿里巴巴旗下通義千問團隊正式發布並開源新一代模型Qwen3。此次發布的Qwen3系列涵蓋了多個模型類型,包括2款參數規模為30B和235B的混合專家(MoE)模型,以及6款參數從0.6B到32B的密集模型。
作為國內首個混合推理模型家族,一經推出便迅速引發開源圈的激烈討論:Qwen3能否成為下一個DeepSeek?
發布後不久,華為計算官方發文稱,昇騰MindSpeed和MindIE一直以來同步支持Qwen系列模型,此次Qwen3系列開源後,已在MindSpeed和MindIE中實現開箱即用,完成了Qwen3的0Day適配。海光信息方面也表示,其DCU迅速完成對全部8款模型的無縫適配與調優。
“發布第二天,我們已經完成了本地化部署Qwen3-30B-A3B,用了單卡4090,目前對C端用戶開放。”共績算力COO王鵬告訴《IT時報》記者,目前Qwen3部署成本較低,Qwen3-235B-A22B只需要4張H20,而其小模型的部署成本則更低。亦有算力集群公司的工作人員告訴記者,Qwen3發布第二天已接到客戶訂單。
成本較DeepSeek大幅下降 仍未解決幻覺問題
與此前的模型相比,Qwen3有着明顯提升。
在架構上,Qwen3採用混合專家(MoE)架構,以旗艦模型Qwen3-235B-A22B為例,總參數量高達235B,但激活僅需22B,大大降低了運行時對算力的即時需求。
這一設計使得模型在面對不同複雜程度的任務時,能夠靈活調配計算資源,針對簡單問題快速響應,複雜問題深度思考,實現“快思考”與“慢思考”的結合,兼顧效率與準確性,為模型應用開拓了更廣闊的空間,有望改變行業對模型應用場景適配的傳統思路。

預訓練數據量的提升也是Qwen3的一大亮點。官方數據顯示,其數據量躍升至36T,是Qwen2.5的三倍之多。多輪強化學習的運用,將非思考模式巧妙融入思考模型,優化了模型的智能處理邏輯,進一步提升了模型在推理、指令遵循、工具調用以及多語言能力等方面的表現。
與DeepSeek-R1相比,Qwen3參數量僅為其1/3,成本大幅下降。在部署方面,僅需4張H20即可部署Qwen3滿血版,顯存佔用僅為性能相近模型的三分之一。“這對於中小企業和個人開發者而言,極大降低了使用高性能模型的成本門檻和部署時間。”王鵬表示。
但也有不少AI發燒友實測後在社交平台上指出,Qwen3在長文本能力上的表現並不算突出,有一定幻覺率,但在生成複雜代碼、數學推理等方面,思考模式的表現明顯好於非思考模式。《IT時報》記者使用Qwen3網頁版嘗試生成關於“去年五一小長假旅遊數據與景區特性關聯”的報告,Qwen3“普通”模式未能給出準確數據支持,出現了較高的幻覺率,但在“深度思考”模式下,幻覺率大幅降低,數據更加準確。
祭出AI“雙子星”戰略 阿里迫切想在C端站穩腳跟
在當下AI賽道,科技巨頭們的每一步落子都備受矚目。
近期,一則有關算力搶購的傳聞甚囂塵上,傳言騰訊、阿里、字節跳動紛紛下場,重金爭搶GPU算力資源。雖然字節跳動已出面闢謠,稱相關信息不實,但這一傳聞本身,足以反映科技大廠對AI戰略布局的重視與急切。
作為AI發展的根基,算力的重要性不言而喻。阿里此前更是公開表態,未來三年將投入超3800億元用於雲和AI硬件基礎設施建設。
當前,阿里集團各個業務板塊將AI作為重要KPI,從阿里的整體AI戰略布局來看,對AI的投入持續加大,試圖強化通義千問與夸克的“雙子星”格局。通義千問專註於支撐雲上智能,夸克則着力打造端側入口,協同推動阿里AI To C戰略的落地。
與此前最大的不同是,“夸克”和“通義”成為Qwen3的主要體驗入口,這兩大App所有用戶均可免費使用這一最新的開源模型。

“通義App在C端並沒有打出聲量,只能委以夸克重任。”一位阿里內部人士曾對《IT時報》記者表示。
通義千問憑藉在多模態處理和複雜任務推理方面的技術優勢,曾為阿里的B端企業服務及開發者生態提供了有力支撐。諸如飛豬旅行藉助通義千問多模態模型,實現了用戶方言語音規划行程的功能;Rokid AR眼鏡搭載其技術後,能夠進行實時翻譯。通義千問在大模型開源上跑得很快,但是,其“通義”App在C端應用上並沒有使出“撒手鐧”。
反倒是夸克突破重圍,第三方數據顯示,2025年3月,夸克的MAU(月活躍人數)達到1.48億,登上國內AI應用榜首。
2024年底至2025年初,阿里通過一系列組織架構調整和人才布局推進AI To C戰略,將AI應用“通義”併入智能信息事業群,整合天貓精靈與夸克團隊,並聘請頂尖AI科學家許主洪負責AI To C業務研發。
阿里AI戰略仍有諸多挑戰橫亘在前。通義千問在維持技術優勢的同時,如何進一步降低使用門檻,滿足中小企業多樣化的定製需求,成為亟待解決的難題。其API(應用程序編程接口)價格雖具備一定競爭力,但部分中小企業在技術對接與模型二次開發方面,仍面臨諸多困難。夸克同樣面臨挑戰,隨着用戶數量的快速增長,體驗稀釋問題逐漸凸顯,部分功能在流量增加時響應速度變慢,這就要求夸克必須優化技術架構與服務器性能,以確保用戶體驗的穩定性。
AI市場競爭激烈,騰訊的混元大模型依託微信龐大的用戶基礎和生態優勢,在微信多個入口為元寶爭取亮相的機會,對C端用戶形成“繭房式包裹”。字節跳動旗下的豆包藉助旗下抖音的推流優勢,在2024年11月MAU飆升至5998萬,幾乎長期霸榜AI應用下載量榜單前三。
雖然手握通義和夸克“雙子星”,一條腿邁進開源圈,一條腿邁向C端用戶,但在巨頭環伺下,阿里AI戰略的前路仍充滿變數。
排版/ 季嘉穎
圖片/ 通義 東方IC
來源/《IT時報》公眾號vittimes
E N D