4張H20可跑Qwen3滿血 阿里為AI「雙子星」戰略砸下3800億

2025年05月17日07:30:31 財經 7196
4張H20可跑Qwen3滿血 阿里為AI「雙子星」戰略砸下3800億 - 天天要聞

阿里祭出AI「雙子星」狙擊大廠圍城

作者/ IT時報記者 毛宇

編輯/ 孫妍

4月29日凌晨,阿里巴巴旗下通義千問團隊正式發布並開源新一代模型Qwen3。此次發布的Qwen3系列涵蓋了多個模型類型,包括2款參數規模為30B和235B的混合專家(MoE)模型,以及6款參數從0.6B到32B的密集模型。

作為國內首個混合推理模型家族,一經推出便迅速引發開源圈的激烈討論:Qwen3能否成為下一個DeepSeek?

發布後不久,華為計算官方發文稱,昇騰MindSpeed和MindIE一直以來同步支持Qwen系列模型,此次Qwen3系列開源後,已在MindSpeed和MindIE中實現開箱即用,完成了Qwen3的0Day適配。海光信息方面也表示,其DCU迅速完成對全部8款模型的無縫適配與調優。

「發布第二天,我們已經完成了本地化部署Qwen3-30B-A3B,用了單卡4090,目前對C端用戶開放。」共績算力COO王鵬告訴《IT時報》記者,目前Qwen3部署成本較低,Qwen3-235B-A22B只需要4張H20,而其小模型的部署成本則更低。亦有算力集群公司的工作人員告訴記者,Qwen3發布第二天已接到客戶訂單。

成本較DeepSeek大幅下降 仍未解決幻覺問題

與此前的模型相比,Qwen3有著明顯提升。

在架構上,Qwen3採用混合專家(MoE)架構,以旗艦模型Qwen3-235B-A22B為例,總參數量高達235B,但激活僅需22B,大大降低了運行時對算力的即時需求。

這一設計使得模型在面對不同複雜程度的任務時,能夠靈活調配計算資源,針對簡單問題快速響應,複雜問題深度思考,實現「快思考」與「慢思考」的結合,兼顧效率與準確性,為模型應用開拓了更廣闊的空間,有望改變行業對模型應用場景適配的傳統思路。

4張H20可跑Qwen3滿血 阿里為AI「雙子星」戰略砸下3800億 - 天天要聞

預訓練數據量的提升也是Qwen3的一大亮點。官方數據顯示,其數據量躍升至36T,是Qwen2.5的三倍之多。多輪強化學習的運用,將非思考模式巧妙融入思考模型,優化了模型的智能處理邏輯,進一步提升了模型在推理、指令遵循、工具調用以及多語言能力等方面的表現。

與DeepSeek-R1相比,Qwen3參數量僅為其1/3,成本大幅下降。在部署方面,僅需4張H20即可部署Qwen3滿血版,顯存佔用僅為性能相近模型的三分之一。「這對於中小企業和個人開發者而言,極大降低了使用高性能模型的成本門檻和部署時間。」王鵬表示。

但也有不少AI發燒友實測後在社交平台上指出,Qwen3在長文本能力上的表現並不算突出,有一定幻覺率,但在生成複雜代碼、數學推理等方面,思考模式的表現明顯好於非思考模式。《IT時報》記者使用Qwen3網頁版嘗試生成關於「去年五一小長假旅遊數據與景區特性關聯」的報告,Qwen3「普通」模式未能給出準確數據支持,出現了較高的幻覺率,但在「深度思考」模式下,幻覺率大幅降低,數據更加準確。

祭出AI「雙子星」戰略 阿里迫切想在C端站穩腳跟

在當下AI賽道,科技巨頭們的每一步落子都備受矚目。

近期,一則有關算力搶購的傳聞甚囂塵上,傳言騰訊、阿里、位元組跳動紛紛下場,重金爭搶GPU算力資源。雖然位元組跳動已出面闢謠,稱相關信息不實,但這一傳聞本身,足以反映科技大廠對AI戰略布局的重視與急切。

作為AI發展的根基,算力的重要性不言而喻。阿里此前更是公開表態,未來三年將投入超3800億元用於雲和AI硬體基礎設施建設。

當前,阿里集團各個業務板塊將AI作為重要KPI,從阿里的整體AI戰略布局來看,對AI的投入持續加大,試圖強化通義千問與夸克的「雙子星」格局。通義千問專註於支撐雲上智能,夸克則著力打造端側入口,協同推動阿里AI To C戰略的落地。

與此前最大的不同是,「夸克」和「通義」成為Qwen3的主要體驗入口,這兩大App所有用戶均可免費使用這一最新的開源模型。

4張H20可跑Qwen3滿血 阿里為AI「雙子星」戰略砸下3800億 - 天天要聞

「通義App在C端並沒有打出聲量,只能委以夸克重任。」一位阿里內部人士曾對《IT時報》記者表示。

通義千問憑藉在多模態處理和複雜任務推理方面的技術優勢,曾為阿里的B端企業服務及開發者生態提供了有力支撐。諸如飛豬旅行藉助通義千問多模態模型,實現了用戶方言語音規划行程的功能;Rokid AR眼鏡搭載其技術後,能夠進行實時翻譯。通義千問在大模型開源上跑得很快,但是,其「通義」App在C端應用上並沒有使出「撒手鐧」。

反倒是夸克突破重圍,第三方數據顯示,2025年3月,夸克的MAU(月活躍人數)達到1.48億,登上國內AI應用榜首。

2024年底至2025年初,阿里通過一系列組織架構調整和人才布局推進AI To C戰略,將AI應用「通義」併入智能信息事業群,整合天貓精靈與夸克團隊,並聘請頂尖AI科學家許主洪負責AI To C業務研發。

阿里AI戰略仍有諸多挑戰橫亘在前。通義千問在維持技術優勢的同時,如何進一步降低使用門檻,滿足中小企業多樣化的定製需求,成為亟待解決的難題。其API(應用程序編程介面)價格雖具備一定競爭力,但部分中小企業在技術對接與模型二次開發方面,仍面臨諸多困難。夸克同樣面臨挑戰,隨著用戶數量的快速增長,體驗稀釋問題逐漸凸顯,部分功能在流量增加時響應速度變慢,這就要求夸克必須優化技術架構與伺服器性能,以確保用戶體驗的穩定性。

AI市場競爭激烈,騰訊的混元大模型依託微信龐大的用戶基礎和生態優勢,在微信多個入口為元寶爭取亮相的機會,對C端用戶形成「繭房式包裹」。位元組跳動旗下的豆包藉助旗下抖音的推流優勢,在2024年11月MAU飆升至5998萬,幾乎長期霸榜AI應用下載量榜單前三。

雖然手握通義和夸克「雙子星」,一條腿邁進開源圈,一條腿邁向C端用戶,但在巨頭環伺下,阿里AI戰略的前路仍充滿變數。

排版/ 季嘉穎

圖片/ 通義 東方IC

來源/《IT時報》公眾號vittimes

E N D

財經分類資訊推薦

金價暴跌!金飾價格全線跌破1000元 - 天天要聞

金價暴跌!金飾價格全線跌破1000元

16日國際油價上漲全周累計上漲超2%原油期貨市場方面,交易員們仍在關注美伊核談判的最新進展。有消息人士稱,談判雙方仍有一些問題亟待解決。這一消息部分緩解了市場對於原油供應可能增加的擔憂情緒,國際油價周五止跌反彈,美油期貨和布油期貨主力合約價
八百塊的鴻蒙新機,華為和蘋果這一刻合體! - 天天要聞

八百塊的鴻蒙新機,華為和蘋果這一刻合體!

如果是老機友,應該對華為手機這幾年的艱辛歷程不陌生。在2019年中,華為突然遭到了來自美國的極限打壓,這種打壓是硬體和軟體兩方面的,不僅迅速的斷掉了原本已經逐漸和高通處理器追平的麒麟處理器,讓麒麟9000成為"絕唱",系統上也不再授權GMS
中國國際證券戰略入股極度證券,開啟全球市場數字化布局新時代 - 天天要聞

中國國際證券戰略入股極度證券,開啟全球市場數字化布局新時代

(2025 年 5 月 16日,香港)中國國際證券(CIS)今日宣布完成對全球領先金融科技平台極度證券(JD Trader)的戰略投資(控股比例約55%),此次合作將整合雙方在傳統金融與金融科技領域的優勢,構建覆蓋AI、大數據、區塊鏈、雲計算等技術運用的金融交易生態,標誌著中國國際證券在全球化與數字化戰略上邁出關鍵一步。 強強...
這一巨頭突發!股價已大跌近60%… - 天天要聞

這一巨頭突發!股價已大跌近60%…

當地時間周五,美國總統特朗普表示,美國可能在「未來兩到三周內」單方面向多個貿易夥伴發送函件,確定新的關稅稅率,以取代正式貿易談判。這一表態使投資者期待關稅政策儘快明朗化。此外,在消化了近兩天公布的多項經濟數據後,市場預期今年美聯儲還將降息兩
天價離婚!她分走近3億元 - 天天要聞

天價離婚!她分走近3億元

5月16日,金圓股份披露其實際控制人之一離婚財產分割的最新進展,趙輝已將其直接持有的8.505%公司股份轉讓給前妻潘穎。如按5月16日4.34元/股的收盤價測算,目前潘穎已獲得的股份對應市值約2.87億元。
10戶中央企業11名領導人員職務任免 - 天天要聞

10戶中央企業11名領導人員職務任免

國資委網站截圖中國物流集團有限公司、中國電氣裝備集團有限公司徐鴻任中國物流集團有限公司黨委副書記、董事,提名為中國物流集團有限公司總經理人選;免去其中國電氣裝備集團有限公司黨委常委職務,不再擔任中國電氣裝備集團有限公司總會計師職務。鍾吉昌任