高通推出兩款AI晶元欲挑戰英偉達,股價一度漲逾20%

10月27日消息,高通正式宣布進軍數據中心ai晶元市場,推出兩款全新ai加速器——ai200與ai250,以及配套的機架級伺服器系統。這一戰略轉向標誌著高通從移動設備晶元製造商轉向ai基礎設施供應商,直接挑戰當前由英偉達與amd主導的高性能計算市場。

受此消息推動,高通美股周一一度大漲逾20%,最高創下205.55美元的52周新高,隨後股價回落。

據了解,這兩款新品主要面向ai推理(inference)環節,而非模型訓練。

高通表示,ai200將於2026年上市,ai250預計2027年推出,後續還將於2028年推出第三代產品,形成每年一代的更新節奏。

高通表示,這些晶元基於其核心技術hexagon神經處理單元(npu),從智能手機和pc晶元的npu架構「放大」至數據中心級別,充分利用高通在移動ai和低功耗計算方面的優勢。

ai新品亮點:低功耗、高性價比與模塊化部署

根據高通介紹,ai200與ai250支持機架級液冷集成,最多可將72枚晶元協同組成一台「超級計算機」,滿足大型ai實驗室運行模型的需求。整機功耗約160千瓦,與英偉達的部分gpu伺服器相當,但高通聲稱整體擁有成本(tco)更低。

其中,ai200晶元是一款專為ai推理而設計的機架級解決方案,重點優化大語言模型(llm)和多模態模型(lmm)等ai任務的運行效率。單卡可配備768gb lpddr內存,在保持較低成本的同時提升內存容量,為大規模推理任務提供靈活的擴展空間。

ai250在此基礎上引入了近存儲計算(near-memory computing)架構,在內存帶寬和能效方面實現代際躍升。該方案的有效內存帶寬提升超過10倍,功耗顯著降低,從而提高ai推理過程的硬體利用率,滿足客戶對性能與成本平衡的要求。

ai200與ai250均搭載高通為數據中心定製的ai軟體堆棧,覆蓋從應用層到系統軟體層的完整鏈路,專為ai推理任務優化。該堆棧兼容主流的機器學習框架、推理引擎與生成式ai框架,並支持針對llm與lmm的分散式推理(disaggregated serving)等優化技術。

高通同時強調其產品的靈活採購模式——客戶可按需選擇晶元、計算卡或整機系統。高通數據中心與邊緣業務總經理杜爾加·馬拉迪(durga malladi)指出:「客戶既可全盤採用,也可混搭使用。甚至英偉達或amd等競爭對手,也可能在系統中採購我們的cpu組件。」

馬拉迪補充說,高通的目標是以低功耗和更優的成本效益幫助雲計算企業應對數據中心建設中不斷上升的能源與資本支出。麥肯錫數據顯示,到2030年全球數據中心資本支出將超過6.7萬億美元,其中相當比例將流向ai晶元系統。

ai晶元市場目前仍由英偉達壟斷,其gpu市佔率超過90%,成為openai、微軟、谷歌等公司訓練和運行大型模型的主要硬體平台。然而,隨著ai計算成本飆升,業界正積極尋找替代方案。

本月初,openai宣布將從amd採購晶元,並考慮戰略入股。與此同時,谷歌、亞馬遜和微軟均在自研ai加速器,以減少對英偉達的依賴。

高通此次入局被視為押注「ai推理市場」的關鍵一步。推理環節對功耗與成本更為敏感,這正是高通的技術優勢所在。該公司在智能手機與筆電晶元中的npu表現出色,如今希望將這一經驗延伸至雲端與大型數據中心。

高通此前曾嘗試進軍伺服器晶元市場。2017年,高通與微軟合作推出centriq 2400平台,但因市場競爭與內部訴訟問題,項目最終擱淺。

隨著ai需求爆發,高通欲借ai200與ai250重新啟動數據中心戰略,並已同沙烏地阿拉伯humain公司簽署部署協議,對方計劃建設功率達200兆瓦的ai推理系統,成為高通首位大客戶。(文/騰訊科技特約編譯無忌,編輯/蘇揚)