日前,英偉達2023 財年第一季度財務報告發布,創下 82.9 億美元的季度收入紀錄,較去年同期增長46%,較上一季度增長8%,其中,數據中心和遊戲收入均創下季度紀錄。
在最近的COMPUTEX 2022上,英偉達展示了在數據中心、機器人、邊緣計算等方面的創新和生態進展。
「三芯」布局即將成型,未來數據中心拼什麼?
英偉達在最近的兩場GTC大會上發布了Grace CPU和Grace Hopper超級晶元,用以支持多種系統架構中的各類計算密集型工作負載。隨著這兩款超級晶元於2023年上半年開始供貨,英偉達CPU+GPU+DPU的產品組合完全形成,這無疑將進一步鞏固英偉達在加速計算領域的地位。

與此同時,全球數據中心的競爭也將更有看點。AMD在加快異構計算平台的搭建和創新,英特爾更強大的CPU、獨立GPU、新的製程工藝也將在接下來幾年內推出。競爭似乎將更為複雜、更為激烈。如何看待2023年之後的數據中心晶元市場?如何持續打造競爭優勢?
黃仁勛告訴,友商都非常優秀,不過,英偉達會專註於非常獨特的發展方式。他指出,人們通常認為英偉達是一家晶元公司,但事實上,英偉達在很多方面都是一家垂直整合的人工智慧公司,構建了完整的軟體堆棧、晶元、系統、系統軟體和人工智慧演算法等,以開放的方式向生態系統提供產品。不論用戶是想採用英偉達的晶元、系統,還是系統軟體、AI方案,英偉達都可以為用戶提供服務。
他強調,加速計算的世界與CPU截然不同,在CPU的世界中,一個不可思議的魔法叫做x86,每個運行x86的軟體都在CPU上運行。然而,沒有用於加速計算的x86。
「因此,每一個加速計算系統、晶元或架構都是英偉達的架構,你必須去建立自己的市場」,他表示,「在英偉達的加速計算平台上運行的應用程序都來之不易,因為我們非常努力地加速分子動力學、量子化學、強化學習,或是RNN、CNN、Transformers、LSTM等,這其中包括很多不同的演算法,我們必須使其在英偉達的平台上運行良好。我們的做法是成為一家全方位的公司,為客戶帶來價值,允許平台開放,讓用戶可以按其所需地集成我們的晶元和技術。」

英偉達創始人兼CEO黃仁勛在Computex 2022期間接受採訪
首次推出液冷GPU,打造綠色數據中心
為了遏制氣候變化,打造高性能、高能效的數據中心,數據中心運營商希望淘汰用於冷卻數據中心內部氣體的冷水機組,因為它們每年會蒸發數百萬加侖的水量。而藉助液冷技術,系統僅需對封閉系統中的少量液體進行循環利用,並能夠著重於主要的發熱點。
液冷技術誕生於大型機時代,在 AI 時代日臻成熟。如今,液冷技術已經以直接晶元(Direct-to-Chip)冷卻的形式廣泛應用於全球高速超級計算機。
日前,英偉達發布了率先採用直接晶元(Direct-to-Chip)冷卻技術的數據中心 PCIe GPU,這在主流伺服器GPU中尚屬首例,助力實現可持續、高效的計算。
英偉達GPU在AI推理和高性能計算方面的能效已比CPU高出20倍。有數據表面,如果將全球所有運行AI和HPC的CPU伺服器切換為GPU加速系統,每年可節省高達11萬億瓦時的能源,節約的能源量可供150 多萬套房屋使用一年。
Equinix 是一家全球服務提供商,旗下管理的數據中心超過 240 個,致力於在業內率先實現氣候中和。Equinix 正在驗證 A100 80GB PCIe 液冷 GPU 在其數據中心的應用,這也是該公司為實現可持續性冷卻和熱量捕獲的綜合性方案中的一部分。GPU 現已進入試用階段,預計將於今年夏季正式發布。
「這是我們實驗室中引入的首款液冷 GPU,我們倍感興奮,因為客戶迫切希望通過可持續的方式來利用 AI,」Equinix 邊緣基礎設施主管 Zac Smith說道。
電源使用效率(PUE)用于衡量數據中心使用的能源有多少直接用於計算任務。當前,數據中心運營商正試圖將 PUE 降至接近 1.0 的理想水平。Equinix 設施目前的平均PUE為 1.48,而其旗下新數據中心的 PUE 最低可低於 1.2。
在單獨的測試中,Equinix 和英偉達均發現:採用液冷技術的數據中心工作負載可與風冷設施持平,同時消耗的能源減少了約 30%。英偉達估計,液冷數據中心的 PUE 可能達到 1.15,遠低於風冷的 PUE 1.6。
在空間相同的條件下,液冷數據中心可以實現雙倍的計算量。這是由於 A100 GPU 僅使用一個 PCIe 插槽,而風冷 A100 GPU 需使用兩個 PCIe 插槽。

NVIDIA 藉助液冷技術達到了節省電力和增加密度的效果
據了解,英偉達計劃於明年推出的一版 A100 PCIe 卡中,將搭載基於Hopper架構的H100 Tensor Core GPU。近期內,英偉達計劃將液冷技術應用於自有高性能數據中心GPU和 NVIDIA HGX 平台。
數據中心是數字基礎設施的重要載體。在「雙碳」目標大背景下,減少碳排放、節能減排是重中之重。這將帶動數據中心液冷技術的加速應用,推動液冷數據中心解決方案的需求增長。
此外,液冷技術的使用範圍並不局限於數據中心,汽車和其他系統也需要利用該項技術來冷卻封閉空間內的高性能系統。液冷GPU 在減少能耗的同時可維持性能不變,從目前的市場進展來看,一些系統製造商已經先行啟動使用計劃,下一步有望快速在更大規模的應用中落地。
據了解,至少有十幾家系統製造商計劃於今年晚些時候在其產品中使用液冷 GPU,包括華碩(ASUS)、永擎電子(ASRock Rack)、富士康工業互聯網(Foxconn Industrial Internet)、技嘉科技(GIGABYTE)、新華三(H3C)、浪潮(Inspur)、英業達(Inventec)、寧暢(Nettrix)、雲達科技(QCT)、 超微(Supermicro)、 緯穎科技(Wiwynn)和超聚變(xFusion)。
多家廠商發布首批基於Grace超級晶元的系統設計
新的數據中心需求正在興起,即通過處理和挖掘海量數據來實現智能的「AI工廠」,而基於英偉達Grace超級晶元的新系統,將為全球新市場和行業注入加速計算的力量。目前,多家計算機製造商宣布將發布首批基於Grace CPU超級晶元和Grace Hopper超級晶元的系統,這些系統將用於數字孿生、AI、HPC、雲圖形和遊戲等各類工作負載。
預計從2023年上半年開始,華碩、富士康工業互聯網、技嘉科技、雲達科技、超微和緯穎將陸續推出幾十款伺服器。基於Grace的系統將與x86和基於Arm的伺服器一同提供廣泛的選擇空間,助力其數據中心實現高性能和高效率。
基於Grace CPU和Grace Hopper超級晶元,即將推出的伺服器有四類系統設計:
NVIDIA HGX Grace Hopper系統:用於AI訓練、推理和HPC,搭載Grace Hopper超級晶元和BlueField-3 DPU。
NVIDIA HGX Grace系統:用於HPC和超級計算,採用純CPU設計,搭載Grace CPU超級晶元和BlueField-3。
NVIDIA OVX系統:用於數字孿生和協作式工作負載,搭載Grace CPU超級晶元、BlueField-3和NVIDIA GPU。
NVIDIA CGX系統:用於雲圖形和遊戲,搭載Grace CPU超級晶元、BlueField-3和NVIDIA A16 GPU。
Grace CPU和Grace Hopper超級晶元伺服器設計組合包括單路、雙路和四路配置的單底板系統,伺服器製造商可根據客戶需求,為這些系統自定義以上四種特定工作負載的設計。
並且,英偉達也正在擴展NVIDIA認證系統計劃,以涵蓋採用Grace CPU和Grace Hopper超級晶元的伺服器以及X86 CPU。預計首批OEM伺服器認證將在合作夥伴系統出貨後不久完成。
AI掀起新一輪機器人技術革命
機器人正在成為AI主要的新應用。根據英偉達的發布,全球有30多家合作夥伴將推出首批基於NVIDIA Jetson AGX Orin的生產系統。十幾家中國台灣的攝像頭、感測器和硬體供應商將推出新產品,用於邊緣AI、AIoT、機器人和嵌入式應用。
Jetson Orin具有NVIDIA Ampere架構GPU、Arm Cortex-A78AE CPU、下一代深度學習和視覺加速器、高速介面、更快的內存帶寬並支持能夠為多個並發AI應用管道提供數據的多模態感測器。
全新Jetson AGX Orin生產模塊能夠為邊緣AI帶來伺服器級的性能。該模塊將於7月上市,Orin NX模塊將於9月上市。NVIDIA Jetson AGX Orin開發者套件自3月的GTC大會開始在全球全面上市,該套件可提供每秒275萬億次運算性能。在針腳兼容性與外形尺寸相同的情況下,其處理能力超過前代產品NVIDIA AGX Xavier 8倍。
寫在最後
在全球宏觀環境充滿挑戰的背景下,英偉達最新的季度財報無疑進一步增強了他們在加速計算領域的雄心。特別是在遊戲創下季度業績紀錄的同時,數據中心終於成為了英偉達最大的業務。這表明深度學習對智能自動化的效用,已經大規模推動了英偉達的產品在數據中心用於AI計算。
英偉達正在為下一步大規模的產品上新做準備,全新的GPU、CPU、DPU和機器人處理器將於下半年陸續上市。隨著這些新的晶元和系統進入市場,將會進一步推動AI、圖形、Omniverse、自動駕駛和機器人的發展,也將進一步驅動相關行業的創新。