4張H20可跑Qwen3滿血阿里為AI“雙子星”戰略砸下3800億

2025年05月17日07:30:31 財經 7196

阿里祭出AI“雙子星”狙擊大廠圍城

作者／ IT時報記者毛宇

編輯／ 孫妍

4月29日凌晨，阿里巴巴旗下通義千問團隊正式發布並開源新一代模型Qwen3。此次發布的Qwen3系列涵蓋了多個模型類型，包括2款參數規模為30B和235B的混合專家（MoE）模型，以及6款參數從0.6B到32B的密集模型。

作為國內首個混合推理模型家族，一經推出便迅速引發開源圈的激烈討論：Qwen3能否成為下一個DeepSeek？

發布後不久，華為計算官方發文稱，昇騰MindSpeed和MindIE一直以來同步支持Qwen系列模型，此次Qwen3系列開源後，已在MindSpeed和MindIE中實現開箱即用，完成了Qwen3的0Day適配。海光信息方面也表示，其DCU迅速完成對全部8款模型的無縫適配與調優。

“發布第二天，我們已經完成了本地化部署Qwen3-30B-A3B，用了單卡4090，目前對C端用戶開放。”共績算力COO王鵬告訴《IT時報》記者，目前Qwen3部署成本較低，Qwen3-235B-A22B只需要4張H20，而其小模型的部署成本則更低。亦有算力集群公司的工作人員告訴記者，Qwen3發布第二天已接到客戶訂單。

成本較DeepSeek大幅下降仍未解決幻覺問題

與此前的模型相比，Qwen3有着明顯提升。

在架構上，Qwen3採用混合專家（MoE）架構，以旗艦模型Qwen3-235B-A22B為例，總參數量高達235B，但激活僅需22B，大大降低了運行時對算力的即時需求。

這一設計使得模型在面對不同複雜程度的任務時，能夠靈活調配計算資源，針對簡單問題快速響應，複雜問題深度思考，實現“快思考”與“慢思考”的結合，兼顧效率與準確性，為模型應用開拓了更廣闊的空間，有望改變行業對模型應用場景適配的傳統思路。

預訓練數據量的提升也是Qwen3的一大亮點。官方數據顯示，其數據量躍升至36T，是Qwen2.5的三倍之多。多輪強化學習的運用，將非思考模式巧妙融入思考模型，優化了模型的智能處理邏輯，進一步提升了模型在推理、指令遵循、工具調用以及多語言能力等方面的表現。

與DeepSeek-R1相比，Qwen3參數量僅為其1/3，成本大幅下降。在部署方面，僅需4張H20即可部署Qwen3滿血版，顯存佔用僅為性能相近模型的三分之一。“這對於中小企業和個人開發者而言，極大降低了使用高性能模型的成本門檻和部署時間。”王鵬表示。

但也有不少AI發燒友實測後在社交平台上指出，Qwen3在長文本能力上的表現並不算突出，有一定幻覺率，但在生成複雜代碼、數學推理等方面，思考模式的表現明顯好於非思考模式。《IT時報》記者使用Qwen3網頁版嘗試生成關於“去年五一小長假旅遊數據與景區特性關聯”的報告，Qwen3“普通”模式未能給出準確數據支持，出現了較高的幻覺率，但在“深度思考”模式下，幻覺率大幅降低，數據更加準確。

祭出AI“雙子星”戰略阿里迫切想在C端站穩腳跟

在當下AI賽道，科技巨頭們的每一步落子都備受矚目。

近期，一則有關算力搶購的傳聞甚囂塵上，傳言騰訊、阿里、字節跳動紛紛下場，重金爭搶GPU算力資源。雖然字節跳動已出面闢謠，稱相關信息不實，但這一傳聞本身，足以反映科技大廠對AI戰略布局的重視與急切。

作為AI發展的根基，算力的重要性不言而喻。阿里此前更是公開表態，未來三年將投入超3800億元用於雲和AI硬件基礎設施建設。

當前，阿里集團各個業務板塊將AI作為重要KPI，從阿里的整體AI戰略布局來看，對AI的投入持續加大，試圖強化通義千問與夸克的“雙子星”格局。通義千問專註於支撐雲上智能，夸克則着力打造端側入口，協同推動阿里AI To C戰略的落地。

與此前最大的不同是，“夸克”和“通義”成為Qwen3的主要體驗入口，這兩大App所有用戶均可免費使用這一最新的開源模型。

“通義App在C端並沒有打出聲量，只能委以夸克重任。”一位阿里內部人士曾對《IT時報》記者表示。

通義千問憑藉在多模態處理和複雜任務推理方面的技術優勢，曾為阿里的B端企業服務及開發者生態提供了有力支撐。諸如飛豬旅行藉助通義千問多模態模型，實現了用戶方言語音規划行程的功能；Rokid AR眼鏡搭載其技術後，能夠進行實時翻譯。通義千問在大模型開源上跑得很快，但是，其“通義”App在C端應用上並沒有使出“撒手鐧”。

反倒是夸克突破重圍，第三方數據顯示，2025年3月，夸克的MAU（月活躍人數）達到1.48億，登上國內AI應用榜首。

2024年底至2025年初，阿里通過一系列組織架構調整和人才布局推進AI To C戰略，將AI應用“通義”併入智能信息事業群，整合天貓精靈與夸克團隊，並聘請頂尖AI科學家許主洪負責AI To C業務研發。

阿里AI戰略仍有諸多挑戰橫亘在前。通義千問在維持技術優勢的同時，如何進一步降低使用門檻，滿足中小企業多樣化的定製需求，成為亟待解決的難題。其API（應用程序編程接口）價格雖具備一定競爭力，但部分中小企業在技術對接與模型二次開發方面，仍面臨諸多困難。夸克同樣面臨挑戰，隨着用戶數量的快速增長，體驗稀釋問題逐漸凸顯，部分功能在流量增加時響應速度變慢，這就要求夸克必須優化技術架構與服務器性能，以確保用戶體驗的穩定性。

AI市場競爭激烈，騰訊的混元大模型依託微信龐大的用戶基礎和生態優勢，在微信多個入口為元寶爭取亮相的機會，對C端用戶形成“繭房式包裹”。字節跳動旗下的豆包藉助旗下抖音的推流優勢，在2024年11月MAU飆升至5998萬，幾乎長期霸榜AI應用下載量榜單前三。

雖然手握通義和夸克“雙子星”，一條腿邁進開源圈，一條腿邁向C端用戶，但在巨頭環伺下，阿里AI戰略的前路仍充滿變數。

排版／季嘉穎

圖片／通義東方IC

來源／《IT時報》公眾號vittimes

E N D