人們常說,公司(尤其是擁有巨額 IT 預算的大公司)不會購買產品,他們購買的是路線圖。沒有人願意費盡心思為一款最終成為一次性產品的產品優化軟體,迫使他們移植代碼並針對另一台設備進行調整。
確實有這樣的事。
因此,對於試圖讓人們購買其計算引擎的晶元製造商來說,擁有未來的產品路線圖與證明過去曾擁有路線圖並能按照路線引導產品推向市場的能力一樣重要。
今年是年初,數據中心計算引擎是我們最關心的問題,我們花了一些時間制定了一套從 2023 年到 2027 年的 CPU、GPU 和 AI 加速器總體路線圖。今天,我們將研究當今市場上的主流 CPU 以及即將推出的 CPU。我們將分別研究 GPU 和定製 AI 加速器。
為了使事情相對簡單,我們的 CPU 路線圖不包括特殊處理器,例如 AMD 和英特爾為電信和服務提供商市場創建的處理器,或者就 AMD 而言,帶有垂直 L3 高速緩存的 Epyc X 變體,或者就英特爾而言,具有 HBM 內存而不是普通 DDR5 內存的 Xeon 變體。
為簡單起見,我們將處理器的發布日期四捨五入到最近的日曆季度,對於發布日期不明確的未來產品,我們已儘力估計其發布時間。如果我們認為計算引擎將長期可用 - Nvidia 的「Vera」 Arm 伺服器 CPU 或 IBM 即將推出的「Cirrus+」 Power11 和「Telum II」 z17 處理器 - 我們會將其計算到未來的範圍。我們還將英特爾至強系列重新命名為「Sapphire Rapids」的 Xeon 4 和「Emerald Rapids」的 Xeon 5,因為我們厭倦了試圖記住哪一個是第四代,哪一個是第五代。夠了。
我們可以嘗試將許多顯著特徵塞進這些圖表中,但我們堅持使用基本特徵:CPU 的代號和名稱、計算核心的蝕刻工藝和蝕刻工廠、核心類型以及系列中頂級 bin 部件的核心和線程數量。在某個時候,我們將擴展它以添加峰值整數和浮點性能,如果我們能獲得頂級 bin 部件的 SPEC 評級,可能會添加。
X86處理器仍然是出貨量領先者,這就是為什麼 AMD 的 Epyc CPU 和英特爾的 Xeon CPU 位居榜首的原因。
AMD 和英特爾都已將大部分主流伺服器 CPU 投入到 2025 年的市場,但英特爾還將在 2025 年第一季度推出更多 CPU,而 AMD 有可能推出一款帶有垂直緩存、針對 HPC 工作負載的「Turin-X」變體,為我們帶來驚喜。
今年唯一有望推出的新型主流伺服器 CPU 是英特爾的「Clearwater Forest」 Xeon 7,預計於今年年底上市。如果計劃順利實施,Clearwater Forest 將成為英特爾首款採用 18A(1.8 納米 RibbonFET)製造工藝的 CPU。有傳言稱,這款 Xeon 7 E 核心部件(節能的縮寫,基於 Atom 核心的變體「Darkmont」,缺少同步多線程和 AVX-512 矢量數學單元等)將在四個區塊中擁有多達 288 個核心,是英特爾產品線中它將取代的 Xeon 6「Sierra Forest」6700E 晶元的兩倍。
Xeon 6 6900 系列具有雙倍 E 核心 Sierra Forest 變體,稱為 Xeon 6 6900E,正如您所料,它將於 2025 年第一季度推出,在兩個計算塊中最多可容納 288 個核心。Xeon 6 的高端「Granite Rapids」P 核心版本Xeon 6 6900P於 2024 年 9 月在最初的 Sierra Forest 晶元之前發布,在一個插槽中有 128 個 P 核心,隨後將是較低檔次的 Xeon 6 6700P 部件,峰值為 86 個核心,甚至還有較低檔次的部件,稱為 6500P 和 6300P,我們目前還沒有聽到太多關於它們的消息,預計也將於今年第一季度推出。
Turin 處理器的 Zen 5(常規核心)和 Zen 5c(更薄的核心,緩存更少)變體將陪伴 AMD 度過 2025 年。沒有人預計數據中心的「Venice」Zen 6 和 Zen 6c CPU 會持續到 2026 年,我們認為它們應該會在明年年初開始量產。Zen 6 和 Zen 6c 核心的 IPC 性能有顯著提升,這是合理的預期,我們認為 AMD 將使用縮小至 2 納米的工藝來增加核心數量,並可能稍微提高時鐘頻率。
如果這份 CPU 圖譜顯示到明年,那麼伺服器 CPU 擁有數百個內核將並不罕見。隨著英特爾縮小晶體管尺寸,從而縮小內核尺寸,並在 2026 年使用 18A 工藝推出「Diamond Rapids」Xeon 7 P 核處理器,我們將拭目以待。我們認為英特爾需要與 AMD Venice Epyc 9006 處理器擁有同等的內核數量,這意味著內核數量將增加一倍,達到 256 個。
伺服器 CPU 領域的一大不確定因素是 Nvidia 可能會如何處理其未來的「Vera」CV100 處理器,該處理器預計將於 2026 年推出。Nvidia 首次在晶元設計中使用 Arm Ltd 的「Demeter」Neoverse V2 內核,其「Grace」CG100 處理器於 2023 年第二季度推出。我們認為,它非常希望憑藉 Vera 處理器走在 Arm CPU 內核的最前沿。這可能意味著跳過「Poseidon」V3 內核,跳轉到 Arm 的「Adonis」V4 內核。為了好玩,我們猜了這一點。不管怎樣,我們認為 Nvidia 對 Vera 的關注度不如 NVLink 埠和大量帶寬。該公司已經在最新的 Grace-Blackwell 超級晶元中將兩個「Blackwell」GB200 GPU 加速器與單個 Grace 晶元配對,並且未來的「Rubin」GPU 及其 Vera CPU 的比例可能會達到一比四。要實現這一點可能意味著要將核心數量增加一倍。(顯然,72 個 V2 核心足以滿足一對 Blackwell 的需求,那麼為什麼 144 個 V3 或 V4 核心不足以滿足四台 Rubins 的需求呢?)
只是為了好玩,也為了展示藍色巨人所處的不同世界,我們在 Arm 包的中間添加了 Power 和 z 處理器。我們預計「Cirrus+」 Power11 和「Telum II」 z17 處理器將在今年年底前推出,以提升 Power Systems 和 System z 大型機產品線的性能。我們將很快介紹的 Power11 晶元,與已經在該領域推出近四年的 Power10 晶元相比,它的全部目的都是增加內存帶寬和內存容量。z17 處理器進行了許多調整,包括集成的 DPU 以加速大型機的 I/O 操作,我們早在 2024 年 8 月就對此進行了介紹。這兩款晶元均由 IBM 的處理器製造合作夥伴三星蝕刻,並且在一個插槽上都有 16 個內核,並實現在一個節點有四個插槽、一個系統映像中有四個節點、以及懸掛著數十 TB 主內存的機器中。
大鐵確實與眾不同。
說到這裡,我們回到 Arm 的競爭,我們預計 Ampere Computing 會以相當規律的節奏推出新產品,該公司在 2024 年 7 月就發布了最新的路線圖。該公司認為,它可以每年將核心數量翻一番,到 2027 年,單個插槽將達到 512 個核心。如果以史為鑒,那麼 Ampere 應該會在 2025 年之前加大 256 核伺服器 CPU 的產量,並從今年下半年開始批量出貨,並且它預計 512 核的「Aurora」AmpereOne 晶元將於 2026 年底推出,並在整個 2027 年加大產量。
亞馬遜網路服務尚未透露太多有關其 Graviton 系列 Arm 伺服器 CPU 的計劃,坦率地說,隨著 2024 年即將結束,我們預計會有某種升級。也許是深度分類 Graviton4E,具有一些額外的性能,就像幾年前的 Graviton3E 一樣。我們預計 AWS 直到 2025 年底才會開始談論 Graviton5,我們推測它可能會在 2027 年初談論 Graviton6。
AWS 可能會在核心數量方面採取更激進的措施,但我們認為它不會比我們在 Arm Neoverse 核心或台積電蝕刻晶元工藝方面所展示的更激進。這在很大程度上取決於 AWS 希望以多快的速度將其計算機群從 X86 平台轉移出去。它希望轉移的速度越快,核心數量就會越高,當然,這要歸功於它不想在處理器上為軟體管理太多 NUMA 域。
我們在這份 CPU 路標中為谷歌的 Axion、微軟的 Cobalt、阿里巴巴的倚天、華為科技的 Kunpeng和飛騰的 S5000C-M Arm 處理器標註了佔位符。
我們沒有這些伺服器 CPU 系列的路線圖,更不用說所示處理器的實際規格了。關於它們的細節並不多,這並非偶然。微軟、谷歌和阿里巴巴對向其他公司出售他們的 Arm 伺服器晶元不感興趣,任何路線圖可能只為他們在雲端的 Arm 實例的最大客戶保留。華為技術和飛騰晶元位於中國防火牆後面,實際上很少有人知道更新它們的計劃。
還有一些其他公司可能實際上會製作這個CPU路線圖,例如Tenstorrent、Ventana、Esperanto、Meta Platforms、SiPearl 和 Fujitsu。