
當前,AI的發展正無處不在,速度也不斷超越人們的預期。AI大模型以更加快速、小型、性能強大的方式在演進,也讓端側AI真正實現落地發展。
作為一家計算平台公司,Arm正處於這場AI變革的中心,通過系統層級的方式,幫助合作夥伴更快速地整合技術並擴大規模,以抓住AI帶來的機遇。從雲端到邊緣側等各個應用,Arm正在計算能效與能源效率方面展現領導地位。
在結束台北COMPUTEX行程後,Arm高級副總裁兼終端事業部總經理Chris Bergey到訪北京並接受集微網採訪,分享了在AI方面的洞見和思考。Chris Bergey透露稱最新Armv9旗艦CPU(代號Travis)將於今年晚些時候推出,帶來兩位數的IPC性能提升以及更加出色的AI性能。
端側AI加速落地 Arm的三大優勢
當前,伴隨着AI手機,AI PC的普及,越來越多的端側設備開始具備AI能力。端側設備對於計算量需求的增長,為推動在各個場景中部署AI帶來巨大機遇。
今年也被稱為AI智能體落地元年,以具身機器人為代表的實體AI集中出現,創造出更多應用場景,一些成功的商業項目和初創公司在加速湧現。
在Chris Bergey看來,在AI智能體方面,有兩個領域頗受關注。一是利用AI進行編程、代碼審查和修改。二是利用AI提升客戶支持與客戶服務。
“在上述兩個領域中,一些初創公司正迅速成長,在員工人數不到100人的情況下快速實現一億美元的營收。”Chris Bergey說。
在實體AI方面,機器人技術已經開始在多個領域得到應用,比如機器狗、配送機器人、掃地機器人等。
“這些設備在某種程度上已經實現了自主運行,但很難說它們已經達到了與人類操作相當的智能水平。不過,在接下來的一到三年內,我們很快就會迎來這樣的轉變:當這些設備處於自主模式運行時,其表現將能夠媲美人類操作。這將帶來巨大的發展機遇。”Chris Bergey告訴集微網。
從構建AI系統的基礎要素看,Chris Bergey認為有三個關鍵因素。
一是從雲端到邊緣打造一個無處不在的平台將具有極大的價值。因為大部分情況下AI在端側運行,某些情況下,工作負載將轉移到雲端。因此,擁有一個高度且可移植的平台,對於推動先進技術及產品的實現,以及為現有產品增加新功能非常有價值。
二是電力和每瓦性能。AI催生了巨大的機遇,也造成耗電的增加。當前,數據中心的能耗從兆瓦級 (MW) 躍升至吉瓦 (GW) 級,其中超過50%來自於機架和半導體設備。因此,在AI賦能的世界裡,雖然存在巨大的發展潛力,但也需要海量的計算能力,這意味着“每瓦性能”將成為最關鍵的衡量指標。
三是軟件的重要性。Arm目前擁有全球最大的開發者生態,匯聚超過 2,200 萬名軟件開發者。與此同時,基於Arm架構的芯片出貨量迄今已累計超過3,100億顆。這種規模帶來了一個良性循環:大量的基於Arm技術的設備推動了豐富的Arm軟件生態,而強大的軟件生態又進一步催生了更多硬件的發展機會。
“Arm去年推出了Arm Kleidi,旨在提供一個AI軟件庫,能夠讓AI工作負載在最新的Arm CPU——即Armv9架構上加速運行,同時也具備面向未來的可持續性。截至目前,Kleidi已累計超過80億次安裝,且仍在持續增長中。Kleidi 也與許多全球主流的AI框架進行集成,包括國內的騰訊混元的Angel機器學習框架。”Chris Bergey說。
從數據中心到終端AI 持續拓展市場份額
通過多年的發展,Arm在終端設備和邊緣側應用已經被廣泛熟悉。但實際上,在數據中心領域,Arm也布局十餘年之久,近年來,由於AI技術的推動,以及在能效方面的優勢,Arm的數據中心產品受到更多的關注,也在持續提升市場份額。
譬如,全球最大的雲服務提供商亞馬遜雲科技 (AWS) 有相當一部分自身的工作負載,是運行在基於Arm架構的AWS Graviton處理器上。AWS還曾表示,其超過 90% 的重要客戶(不包括 Amazon)也在使用 Arm 的先進架構,並受益於 Arm 技術的卓越能效,很多客戶都是業界的知名企業。在過去兩年,在AWS新部署的CPU算力中,有超過50%是基於Arm技術的Graviton。
“最初,雲服務提供商自身的第一方工作負載遷移至Arm平台,隨後,第三方工作負載也紛紛轉向Arm平台,這為頭部雲服務提供商帶來了超過40%的能效提升。基於這樣的發展勢頭,我們預計Arm架構將佔據半數2025年出貨到頭部雲服務提供商的算力。”Chris Bergey表示。
在邊緣側,Arm CPU佔據舉足輕重的地位,被廣泛應用於各種主流操作系統 (OS) 的邊緣計算設備中。近年來,Arm架構在PC與平板市場的需求也大幅增長,Arm預計2025年,Arm架構將佔據超過40%的PC與平板整體出貨量。
數據中心和PC此前是Arm架構普及程度相對較低的領域,尤其是數據中心領域,一直被x86架構主導。如果Arm的預測能夠實現,毫無疑問這將會是其一項巨大成就。
這首先得益於Arm近年來推出一系列平台產品在性能上的顯著提升。Chris Bergey重點介紹了Arm與NVIDIA的合作。
DGX Spark是NVIDIA今年發布的桌面級AI PC,搭載了10個Arm Cortex-X925 核心和 10 個 Cortex-A725 核心,並配備了可實現高達 1 PetaFLOPs(即每秒 10^15 次浮點運算)AI性能的 GPU,將數據中心級別的計算能力帶到了桌面級產品。
NVIDIA不僅在邊緣側產品中採用Arm技術,在Grace Blackwell等數據中心產品平台中,也基於Arm架構的CPU與GPU緊密耦合,針對AI所需的帶寬和 I/O 密度進行了深度優化,從而實現了更高效的計算性能。
在手機市場,Chris Bergey也表示,Arm正在為眾多的生態合作夥伴(如 MediaTek)提供最前沿的CPU和GPU 技術,並且這些合作夥伴正與眾多一線手機廠商攜手,將搭載 Arm 技術的優秀手機產品推向市場。
新一代旗艦CPU今年上市 兩位數IPC性能提升
去年Arm推出了包括Cortex-X925在內的新一代旗艦計算平台。Cortex-X925基於Armv9.2架構,實現了IPC性能創紀錄的15%的增長,極大提升了高性能手機SoC的能力表現。去年MediaTek發布的天璣9400系列,以及日前小米發布的玄戒O1都採用了Cortex-X925 CPU,為芯片性能提供了強大的支撐。
Chris Bergey指出,Cortex-X925具備業內最高水平的IPC性能,這一點至關重要。因為 IPC(每時鐘周期指令數)與頻率的乘積決定了整個平台的性能。相較於單純依賴提高頻率來提升性能,提升 IPC可以更高效地實現性能的增強,同時還能顯著改善能耗表現。對於移動終端設備而言,控制功耗無疑是一個關鍵考量因素。
同時,Chris Bergey透露稱,今年晚些時候,Arm將推出新一代Armv9旗艦CPU(代號Travis)。屆時,在目前業內IPC性能最高的Arm處理器基礎上,再次實現兩位數的IPC性能提升。此外,這也將是第一代引入Armv9可伸縮矩陣擴展 (Scalable Matrix Extension, SME) 的處理器,進一步加速處理 AI 工作負載。
在GPU方面,新一代產品(代號Drage)將加入Arm精銳超級分辨率技術 (Arm ASR),使用戶能夠在移動設備上實現遊戲主機級畫質和遊戲體驗。
這兩款產品的結合將引入面向移動端市場的 Arm Lumex CSS 解決方案,為未來消費電子設備上的邊緣 AI 性能奠定基礎。
“我們相信 AI 的未來前景廣闊,而這個未來將由 Arm 及其合作夥伴共同打造,包括我們在中國市場的重要合作夥伴。”Chris Bergey說。