矽谷AI晶元爭霸戰:CPU、GPU和NPU的新時代角逐

2024年06月14日09:33:11 科技 1944

文/陳思進

當前,一場激烈的「AI(人工智慧)大戰」已經在矽谷徹底打響。服務諮詢機構Dealroom和Flow Partners最新公布的報告顯示,全球科技行業正進入以AI為代表的新創新周期。單美股中微軟英偉達蘋果谷歌特斯拉等「七姐妹」,每年在AI和雲基礎設施上投資就高達4000多億美元(約合3萬億元人民幣),覆蓋了從AI晶元、大模型,到人形機器人、自動駕駛、AI醫療等領域。

矽谷AI晶元爭霸戰:CPU、GPU和NPU的新時代角逐 - 天天要聞

6月2日,英偉達創始人兼CEO黃仁勛宣布,英偉達Blackwell晶元現已開始投產。演講中,黃仁勛宣布,英偉達將在2025年推出Blackwell Ultra AI晶元。下一代AI平台名稱為Rubin,該平台將採用HBM4內存。Rubin下一代平台正在開發之中,將於2026年發布,Rubin AI平台將採用HBM4記憶晶元。

據悉,英偉達的第一款Blackwell晶元名為GB200,宣稱是目前「全球最強大的晶元」。目前,供應鏈對GB200寄予厚望,預估2025年出貨量有機會突破百萬顆,將佔英偉達高端GPU出貨量的近40%—50%。

我曾在三年多前的《AI(人工智慧)的三大基石:數據、算力和演算法——漫談人工智慧(番外篇)》(《科普時報》2021年04月23日第3版首發)一文提到,AI的三大基石:數據、演算法和算力,缺一不可,而算力的基礎就是晶元。

那這篇就介紹一次三大主流晶元:CPUIntel)、GPU(英偉達)、以及NPU(AMD)。

一、CPU(中央處理器Central Processing Unit)是計算機系統的核心組件,負責執行計算和控制任務。它的主要功能包括從內存中獲取並執行指令,進行算術和邏輯運算,以及協調計算機各部分的操作。

主要組成部分

算術邏輯單元ALU):執行所有的算術和邏輯運算。

控制單元(CU):解釋指令並指導其他部分完成工作。

寄存器:高速存儲單元,用於暫時存儲數據和指令。

性能指標

CPU性能通常由以下幾個指標衡量:

時鐘速度:以GHz(千兆赫茲)為單位,表示CPU每秒可以執行的周期數。

核心數量:現代CPU通常有多個核心,每個核心可以獨立處理任務,從而提高多任務處理能力。

緩存:臨時存儲器,用於加快數據訪問速度,通常包括L1、L2和L3緩存。

多線程和多核技術

多線程技術:如超線程技術(Hyper-Threading),允許每個物理核心處理多個線程,提高CPU的利用率和性能。

多核技術:在一個CPU晶元上集成多個處理核心,以提高並行處理能力。

通過這些基本信息,可以了解CPU作為計算機系統核心組件的重要性及其工作原理。

Intel:全球最大的CPU製造商之一,以其Core、Xeon等系列著稱。

之前著名的Wintel,就是指由微軟操作系統Windows與Intel CPU所組成的個人計算機

二、那GPU是什麼?

CPU雖然很厲害,但在AI領域,已被GPU所取代。

GPU,全稱為圖形處理單元,最初設計用於處理圖形渲染任務,特別是3D圖形渲染。由於圖形渲染需要大量的矩陣和矢量運算,GPU被設計成能夠高效處理這些並行計算任務。因此,GPU具有大規模並行計算能力,可以同時處理成千上萬個小型計算任務。

隨著深度學習技術的興起,研究人員發現GPU的並行計算能力非常適合用於加速深度學習中的訓練過程。由於深度學習中的大量計算也可以分解為並行任務,GPU迅速成為深度學習訓練的主要計算引擎。

隨著人工智慧和深度學習技術的飛速發展,計算機處理器的種類和功能也在不斷擴展和創新。近年來,NPU(Neural Processing Unit,神經處理單元)逐漸成為計算領域的新熱點。本文將介紹什麼是NPU,並分析其與GPU(Graphics Processing Unit,圖形處理單元)的區別。

三、NPU又是什麼?

NPU,全稱為神經處理單元,是專門為加速神經網路計算而設計的一種處理器。它們主要用於執行深度學習演算法中的矩陣運算和矢量操作。這些運算通常包括卷積神經網路(CNN)、循環神經網路RNN)和其他形式的神經網路中的基本操作,如矩陣乘法、加權求和和激活函數計算等。

NPU的設計目標是優化和加速人工智慧應用的執行效率。與傳統的CPU和GPU相比,NPU具有以下幾個特點:

專用性強:NPU專為神經網路計算優化,能夠高效處理深度學習中的特定任務。

高並行性:NPU通常包含大量並行處理單元,可以同時執行大量的計算任務。

低功耗:由於其專用性,NPU的功耗通常比GPU更低,適用於移動設備和嵌入式系統。

四、NPU和GPU的區別

儘管NPU和GPU都能用於加速神經網路的計算,但它們在設計理念和應用場景上存在顯著差異。

設計初衷:

GPU:最初為圖形渲染設計,後來由於其強大的並行計算能力被廣泛應用於深度學習。

NPU:專為神經網路計算設計,目標是優化深度學習的推理和訓練過程。

架構:

GPU:包含大量通用的並行計算核心,能夠處理多種類型的並行任務,不僅限於神經網路計算。

NPU:通常包含專用的加速模塊,如張量處理單元(TPU),並且針對特定神經網路操作進行了優化。

性能:

GPU:由於其通用性,雖然在神經網路計算上性能不如NPU,但在靈活性和通用計算能力上具有優勢。

NPU:在執行特定的神經網路計算任務時,效率通常比GPU更高,尤其是在推理階段。

功耗:

GPU:功耗較高,適合用於數據中心和桌面計算環境中的深度學習訓練。

NPU:由於其專用性設計,通常在執行神經網路任務時功耗較低,更適合嵌入式和移動設備。

四、總結

GPU和NPU都是當前人工智慧計算的重要工具,各自有著獨特的優勢和適用場景。NPU通過專用設計提供高效的神經網路計算能力,適合用於推理階段和低功耗設備。GPU憑藉其強大的並行計算能力和靈活性,仍然是深度學習訓練的重要計算引擎。隨著技術的不斷發展,我們可以期待NPU和GPU在各自領域中繼續發揮重要作用,為人工智慧的發展提供更強大的計算支持。

簡寫版:矽谷搶灘人工智慧處理器

□ 陳思進

美國矽谷目前正經歷著一場激烈的「人工智慧大戰」。服務諮詢機構的最新報告披露,全球科技行業正進入一個以人工智慧為代表的新創新周期。微軟、英偉達、蘋果、谷歌、特斯拉等科技巨頭每年在人工智慧和雲基礎設施上的投資高達4000多億美元,覆蓋了從處理器、大模型到人形機器人、自動駕駛、人工智慧醫療等眾多領域。

6月2日,英偉達宣布,Blackwell處理器已正式投產,並計劃在2025年推出Blackwell Ultra AI處理器,預計年出貨量有望突破百萬件,佔英偉達高端圖形處理器出貨量的40%至50%。這一消息引起廣泛關注。

人工智慧的發展離不開數據、演算法和算力,而算力的基礎就是處理器。當前,中央處理器、圖形處理器和神經網路處理器是三大主流處理器,各有其獨特的功能和應用領域。

中央處理器是計算機系統的核心組件,負責執行計算和控制任務。它從內存中獲取並執行指令,進行算術和邏輯運算,並協調計算機各部分操作。中央處理器的性能通常由時鐘速度、核心數量和緩存等指標來衡量。現代中央處理器通常有多個核心,每個核心可以獨立處理任務,從而提高了多任務處理能力。作為全球最大的中央處理器製造商之一,Intel的Core和Xeon系列尤為著名。

然而,在人工智慧領域,圖形處理器已逐漸取代了中央處理器。圖形處理器最初設計用於處理圖形渲染任務,尤其是3D圖形渲染。由於圖形渲染需要大量的矩陣和矢量運算,圖形處理器被設計成能高效處理這些並行計算任務的能力。隨著深度學習技術的興起,研究人員發現圖形處理器的並行計算能力,非常適用於加速深度學習中的訓練過程,成為主要計算引擎。

近年來,神經網路處理器逐漸成為計算領域的新熱點。神經網路處理器專門為加速神經網路計算而設計,主要用於執行深度學習演算法中的矩陣運算和矢量操作。與傳統的中央處理器和圖形處理器相比,神經網路處理器具有專用性強、高並行性和低功耗的特點。神經網路處理器專為神經網路計算優化,能高效處理深度學習中的特定任務,其設計目標是優化和加速人工智慧應用的執行效率。

儘管神經網路處理器和圖形處理器都能用於加速神經網路的計算,但它們在設計理念和應用場景上存在顯著差異。

圖形處理器最初為圖形渲染設計,後來由於強大的並行計算能力被廣泛應用於深度學習,而神經網路處理器專為神經網路計算設計,目標是優化深度學習的推理和訓練過程。

圖形處理器包含大量通用的並行計算核心,不僅限於神經網路計算,還能處理多種類型的並行任務。而神經網路處理器通常包含專用的加速模塊,並針對特定神經網路操作進行了優化。

在性能上,圖形處理器雖然在神經網路計算上不如神經網路處理器,但在靈活性和通用計算能力上具有優勢。神經網路處理器在執行特定的神經網路計算任務時,尤其在推理階段,效率通常比圖形處理器更高。

圖形處理器的功耗較高,適用於數據中心和桌面計算環境中的深度學習訓練,而神經網路處理器功耗較低,更適合嵌入式和移動設備。

總的來說,圖形處理器和神經網路處理器都是當前人工智慧計算的重要工具,各自有著獨特的優勢和適用場景。神經網路處理器通過專用設計提供高效的神經網路計算能力,適用於推理階段和低功耗設備。而圖形處理器憑藉其強大的並行計算能力和靈活性,仍然是深度學習訓練的重要計算引擎。隨著技術的不斷發展,我們可以期待神經網路處理器和圖形處理器在各自領域中繼續發揮重要作用,為人工智慧發展提供更強大的計算支持。

2024年06月09日寫於多倫多安大略湖畔

(思進註:除註明作者之外,所有文章皆為思進原創。原創文章,謝絕未保留作者相關信息的任何形式的轉載。【免責聲明】本文僅代表原作者個人的論述和觀點,敬請讀者自行判斷。內容或者數據僅供參考,不構成任何具體投資建議、不作任何商業用途、更不對其真實性負責。投資者據此操作,風險自擔。)

PS. 1、(幾乎)我所有的書都將漸漸地轉為音頻(長篇小說均改編為廣播劇),(獨家)上線喜馬拉雅,已上線了25部。其中,多部專輯已進入了各類收聽排行榜TOP50:如《歸·去·來》廣播劇最佳,曾經進入新專輯TOP10(目前在整個喜馬拉雅的有聲圖書進入TOP100,和眾多經典名著排在一起),另外,《看懂財經新聞的第一本書》《看懂貨幣的第一本書》《白話金融》《投資的方法》等進入財經類TOP30、甚至TOP5……請打開鏈接訂閱收聽:http://m.ximalaya.com/gatekeeper/h5-listen-list?albumId=75881160&uid=77781964

2、香港書展精選暢銷書、科幻長篇小說《超時空拯救》繁體字版新鮮上架,全球發行,音頻版新鮮上架:https://m.ximalaya.com/selfshare/album/76256765

3、金融科普之作《看懂金融的第一本書》(再版),銷量竟然再次超過了基辛格百歲沉澱之作,有點兒不好意思了(凡爾賽一把) ;同時,繁體字版《白話金融》全球發行,音頻版新鮮上架:https://m.ximalaya.com/selfshare/album/81093332

科技分類資訊推薦

清華專家破百年陳規!滬上論壇曝電力革新,陳磊構想太敢了 - 天天要聞

清華專家破百年陳規!滬上論壇曝電力革新,陳磊構想太敢了

聽說了嗎?清華大學的專家居然說要徹底打破電力系統運行了上百年的規矩!就在上海那場新能源論壇上,陳磊研究員拋出個重磅觀點 —— 以後用電不用再看頻率臉色,有功功率想咋調就咋調!這事兒要是真能成,咱們家裡的空調、電動車充電可就再也不會因為電網不
消費活力釋放,上海零售商業形態向「文商旅體展」融合演進 - 天天要聞

消費活力釋放,上海零售商業形態向「文商旅體展」融合演進

2025年二季度,在上海市政府經濟刺激方案推動下,上海商業市場消費活力逐步釋放,但零售物業租賃指標的復甦態勢仍顯平緩。核心商圈平均租金為1877元/平方米/月,平均出租率為94.71%,整體表現與去年同期持平,其中徐家匯、陸家嘴等商圈憑藉成熟商業生態,表現相對突出。但與非核心商圈相比,從存量、新增供應、凈吸納量等指...
OPPO K13 Turbo 系列真機曝光,7 月 21 日發布 - 天天要聞

OPPO K13 Turbo 系列真機曝光,7 月 21 日發布

IT之家 7 月 11 日消息,博主 @i冰宇宙 今日分享了一款帶保密殼的新機真機圖,配備 RGB 燈效以及主動散熱風扇,預計為剛剛官宣的 OPPO K13 Turbo 系列。IT之家注意到,OPPO K13 Turbo 系列將於 7 月 21 日發布,在 GeekBench 6.3.0 中單核成績為 2156 分,多核成績為 6652 分,預計搭載高通驍龍
醒醒吧!CEO猛吹AI寫95%代碼,績效考核卻還在拼程序員手速? - 天天要聞

醒醒吧!CEO猛吹AI寫95%代碼,績效考核卻還在拼程序員手速?

編譯 | Tina在 AI 工具席捲開發圈之後,一批技術老兵的工作方式悄然發生變化。Superhuman (原生 AI 郵件應用)工程負責人 Loic Houssier 正是這場轉型的親歷者之一。這位出身數學背景、擁有密碼學工程經驗的 VP,曾帶領團隊經歷了從大型 B2C 到核心底層架構的複雜挑戰。而當 ChatGPT、Claude Code 等工具走進日常
從領先到落後:英特爾正經歷「寒冬」 - 天天要聞

從領先到落後:英特爾正經歷「寒冬」

【環球網科技綜合報道】7月11日,據外媒報道,英特爾首席執行官陳立武近日在發表內部講話時直言英特爾已不再是領先晶元製造商,甚至不在前十。其市值如今僅約1000億美元,與18個月前相比大幅縮水,而英偉達市值卻一度突破4萬億美元,形成鮮明對比。「二三十年前,我們確實是行業領導者。可如今的世界已經變了,我們已不在全...