老黃贏麻了!英偉達H100訂單排到24年,馬斯克都坐不住了

2023年08月12日12:46:04 科技 1599

夢晨 克雷西 發自 凹非寺

量子位 | 公眾號 QbitAI

煉大模型最佳GPU英偉達H100全部賣空

即使現在立即訂購,也要等2024年Q1甚至Q2才能用上。

這是與英偉達關係密切的雲廠商CoreWeave對華爾街日報透露的最新消息。

從4月初開始,供應就變得異常緊張。僅僅一周之內,預期交貨時間就從合理水平跳到了年底

老黃贏麻了!英偉達H100訂單排到24年,馬斯克都坐不住了 - 天天要聞

全球最大雲廠商亞馬遜AWS也證實了這一消息,CEO Adam Selipsky近期表示:

A100和H100是最先進的……即使對於AWS來說也很難獲得

更早時候,馬斯克還在一場訪談節目中也說過:GPU現在比d品還難獲得

老黃贏麻了!英偉達H100訂單排到24年,馬斯克都坐不住了 - 天天要聞

如果找「黃牛」買,溢價高達25%

Ebay上的價格已從出廠價約36000美元漲到了45000美元,而且貨源稀少。

老黃贏麻了!英偉達H100訂單排到24年,馬斯克都坐不住了 - 天天要聞

這種形勢下,國內的百度位元組阿里騰訊等大型科技公司也向英偉達下了總計50億美元的A800等芯片訂單。

其中只有10億美元的貨能今年內交付,另外80%也要等2024年才行。

那麼現有高端GPU都賣給誰了?這一波產能又是卡在了哪?

H100賣給誰,老黃說了算

ChatGPT爆發以來,擅長訓練大模型的英偉達A100、H100成了香餑餑。

甚至H100已經可以作為初創公司的一種資產,找投資基金獲得抵押貸款。

OpenAIMeta為代表的AI公司,亞馬遜、微軟為代表的雲計算公司,私有雲Coreweave和Lambda,以及所有想煉自家大模型的各類科技公司,需求量都巨大。

然而賣給誰,基本是英偉達CEO黃仁勛說了算。

老黃贏麻了!英偉達H100訂單排到24年,馬斯克都坐不住了 - 天天要聞

據The Information消息,H100這麼緊缺,英偉達把大量的新卡分配給了CoreWeave,對亞馬遜微軟等老牌雲計算公司限量供應

(英偉達還直接投資了CoreWeave。)

外界分析是因為這些老牌公司都在開發自己的AI加速芯片、希望減少對英偉達的依賴,那老黃也就成全他們。

老黃在英偉達內部還把控了公司日常運營的方方面面,甚至包括「審查銷售代表準備對小型潛在客戶說什麼話」

全公司約40名高管直接向老黃彙報,這比Meta小扎和微軟小納的直接下屬加起來還多。

一位英偉達前經理透露,「在英偉達,黃仁勛實際上是每一款產品的首席產品官。」

老黃贏麻了!英偉達H100訂單排到24年,馬斯克都坐不住了 - 天天要聞

前陣子,還傳出老黃幹了一件誇張的事:要求一些小型雲計算公司提供他們的客戶名單,想了解GPU的最終使用者是誰。

外界分析,此舉將使英偉達更了解客戶對其產品的需求,也引起了對英偉達可能利用這些信息謀取額外利益的擔憂。

也有人認為,還有一層原因是老黃想知道誰真的在用卡,而誰只是囤卡不用。

老黃贏麻了!英偉達H100訂單排到24年,馬斯克都坐不住了 - 天天要聞

為什麼英偉達和老黃現在有這麼大的話語權?

主要是高端GPU供需太不平衡,根據GPU Utils網站的測算,H100缺口高達43萬張

作者Clay Pascal根據各種已知信息和傳言估計了AI行業各參與者近期還需要的H100數量。

AI公司方面:

  • OpenAI可能需要5萬張H100來訓練GPT-5
  • Meta據說需要10萬
  • InflectionAI的2.2萬張卡算力集群計劃已公布
  • 主要AI初創公司如Anthropic、Character.ai、歐洲的MistraAI和HelsingAI需求各自在1萬數量級。

雲計算公司方面:

  • 大型公有雲里,亞馬遜、微軟、谷歌甲骨文都按3萬算,共12萬
  • 以CoreWeave和Lambda為代表的私有雲加起來總共需要10萬

加起來就是43.2萬了。

這還沒算一些摩根大通、Two Sigma等也開始部署自己算力集群的金融公司和其他行業參與者。

那麼問題來了,這麼大的供應缺口,就不能多生產點嗎?

老黃也想啊,但是產能被卡住了

產能這次卡在哪裡?

其實,台積電已經為英偉達調整過一次生產計划了。

不過還是沒能填補上如此巨大的缺口。

英偉達DGX系統副總裁兼總經理Charlie Boyle稱,這次並不是卡在晶圓,而是台積電的CoWoS封裝技術產能遇到了瓶頸。

與英偉達搶台積電產能的正是蘋果,要在9月發佈會之前搞定下一代iPhone要用的A17芯片。

而台積電方面近期表示,預計需要1.5年才能使封裝工藝積壓恢復正常。

CoWoS封裝技術是台積電的看家本領,台積電之所以能擊敗三星成為蘋果的獨家芯片代工廠靠的就是它。

這項技術封裝出的產品性能高、可靠性強,H100能擁有3TB/s(甚至更高)的帶寬正是得益於此。

老黃贏麻了!英偉達H100訂單排到24年,馬斯克都坐不住了 - 天天要聞

CoWoS全名叫Chip-on-Wafer-on-Substrate,是一種在晶圓層面上的芯片集成技術。

這項技術可以將多個芯片封裝厚度僅有100μm的硅中介層上。

據介紹,下一代中介層面積將達到6倍reticle,也就是約5000mm²。

目前為止,除了台積電,沒有哪家廠商擁有這個水平的封裝能力。

老黃贏麻了!英偉達H100訂單排到24年,馬斯克都坐不住了 - 天天要聞

雖然CoWoS的確強悍,但沒有它就不行嗎?其他廠商能不能代工呢?

先不說老黃已經表示過「不考慮新增第二家H100代工廠」。

從現實上看,可能也真的不行。

英偉達此前曾和三星有過合作,但後者從未給英偉達生產過H100系列產品,甚至其他5nm製程的芯片。

據此有人推測,三星的技術水平可能無法滿足英偉達對尖端GPU的工藝需求。

至於英特爾……他們的5nm產品好像還遲遲沒有問世。

老黃贏麻了!英偉達H100訂單排到24年,馬斯克都坐不住了 - 天天要聞

既然讓老黃換生產廠家行不通,那用戶直接改用AMD怎麼樣?

AMD,Yes?

如果單論性能的話,AMD倒的確是慢慢追上來了。

AMD最新推出的MI300X,擁有192GB的HBM3內存、5.2TB/s的帶寬,可運行800億參數模型。

而英偉達剛剛發佈的DGX GH200,內存為141GB的HBM3e,帶寬則為5TB/s。

但這並不意味着AMD能馬上填補N卡的空缺——

英偉達真正的「護城河」,在於CUDA平台。

老黃贏麻了!英偉達H100訂單排到24年,馬斯克都坐不住了 - 天天要聞

CUDA已經建立起一套完整的開發生態,意味着用戶要是購買AMD產品,需要更長時間來進行調試。

一名某私有雲公司的高管表示,沒人敢冒險花3億美元實驗部署10000個AMD GPU。

這名高管認為,開發調試的周期可能至少需要兩個月。

在AI產品飛速更新換代的大背景下,兩個月的空檔期對任何一家廠商來說可能都是致命的。

老黃贏麻了!英偉達H100訂單排到24年,馬斯克都坐不住了 - 天天要聞

不過微軟倒是向AMD伸出了橄欖枝。

此前有傳聞稱 ,微軟準備和AMD共同開發代號為「雅典娜」的AI芯片。

而更早之前,MI200發佈時,微軟第一個宣布採購,並在其雲平台Azure上部署。

比如前一陣MSRA的新大模型基礎架構RetNet就是在512張AMD MI200上訓練的。

老黃贏麻了!英偉達H100訂單排到24年,馬斯克都坐不住了 - 天天要聞

在英偉達佔據幾乎整個AI市場的格局下,可能需要有人帶頭衝鋒,先整個大型AMD算力集群打樣,才有人敢於跟進。

不過短時間內,英偉達H100、A100還是最主流的選擇。

One More Thing

前一陣蘋果發佈最高支持192GB內存新款M2 Ultra芯片的時候,還有不少從業者暢享過用它來微調大模型。

畢竟蘋果M系列芯片的內存顯存是統一的,192GB內存就是192GB顯存,可是80GB H100的2.4倍,又或者24GB RTX4090的8倍。

老黃贏麻了!英偉達H100訂單排到24年,馬斯克都坐不住了 - 天天要聞

然鵝,有人真的把這台機器買到手後,實際測試訓練速度還不如英偉達RTX3080TI微調都不划算,訓練就更別想了。

畢竟M系列芯片的算力部分不是專門針對AI計算優化的,光大顯存也沒用。

煉大模型,看來主要還是得靠H100,而H100又求之不得。

面對這種情況,網絡上甚至流傳着一首魔性的「GPU之歌」

很洗腦,慎入。

,時長04:10

GPU之歌本家
https://www.youtube.com/watch?v=YGpnXANXGUg

參考鏈接:
[1]https://www.barrons.com/articles/nvidia-ai-chips-coreweave-cloud-6db44825

[2]https://www.ft.com/content/9dfee156-4870-4ca4-b67d-bb5a285d855c
[3]https://www.theinformation.com/articles/in-an-unusual-move-nvidia-wants-to-know-its-customers-customers
[4]https://www.theinformation.com/articles/ceo-jensen-huang-runs-nvidia-with-a-strong-hand
[5]https://gpus.llm-utils.org/nvidia-h100-gpus-supply-and-demand/#which-gpus-do-people-need
[6]https://3dfabric.tsmc.com/english/dedicatedFoundry/technology/cowos.htm
[7]https://developer.nvidia.com/blog/cuda-10-features-revealed/
[8]https://www.theverge.com/2023/5/5/23712242/microsoft-amd-ai-processor-chip-nvidia-gpu-athena-mi300
[9]https://www.amd.com/en/press-releases/2022-05-26-amd-instinct-mi200-adopted-for-large-scale-ai-training-microsoft-azure

— 完 —

量子位 QbitAI · 頭條號簽約

關注我們,第一時間獲知前沿科技動態

科技分類資訊推薦

國泰重返全球最佳航空三甲!蟬聯最佳經濟艙,再獲最佳機上娛樂 - 天天要聞

國泰重返全球最佳航空三甲!蟬聯最佳經濟艙,再獲最佳機上娛樂

國泰航空於享負盛名的2025年Skytrax《全球航空公司大獎》中榮獲「全球最佳航空公司」第三名,同時更贏得兩項傑出榮譽:連續兩年蟬聯「全球最佳經濟艙航空公司」以及在三年內第二次獲頒「全球最佳機上娛樂」殊榮。行政總裁林紹波表示:「國泰航空晉身『全球最佳航空公司『三甲,較去年躍升兩位,以及再次被評選為』全球最佳...
REDMI K80至尊版配備7410mAh大電池 小米手機史上最強 - 天天要聞

REDMI K80至尊版配備7410mAh大電池 小米手機史上最強

站長之家(ChinaZ.com) 6月17日 消息:今日,REDMI官方微博透露了REDMI K80至尊版的諸多關鍵信息。在續航方面,REDMI K80至尊版表現堪稱驚艷。它配備了一塊7410mAh的大容量電池,這一配置在小米手機中堪稱史上最強。同時,該機還搭配了微架構級性能調優技術,有效降低了功耗,讓用戶能夠持久暢玩。其DOU續航成績達到了2.26天...
特朗普正式進軍手機市場 T1 Phone手機發佈: 售價約3582元 - 天天要聞

特朗普正式進軍手機市場 T1 Phone手機發佈: 售價約3582元

站長之家(ChinaZ.com)6月17日 消息:特朗普集團正式宣布進軍移動通信市場,推出自有品牌移動網絡服務特朗普移動(Trump Mobile),並同步發佈旗下首款智能手機T1Phone。T1Phone將於9月正式上市,該機將在美國本土製造,售價定為499美元,摺合人民幣約3582元。消費者若想預購,需先支付100美元的首付。在外觀設計上,T1Pho..
印度民航總局:未發現印航波音 787 機隊存在重大安全問題 - 天天要聞

印度民航總局:未發現印航波音 787 機隊存在重大安全問題

IT之家 6 月 18 日消息,當地時間 12 日,印度古吉拉特邦艾哈邁達巴德機場附近發生墜機事故。目前墜機事故遇難人數已升至 279 人,僅一名乘客倖存。遇難者包括 241 名機上人員和 38 名地面人員。據央視新聞,當地時間 17 日晚,印度民航總局發表了審查印度航空和印度航空快運運營情況的公告。公告稱,近期對印度航空波音 7...
REDMI K80 至尊版新預熱,豪華性能旗艦 - 天天要聞

REDMI K80 至尊版新預熱,豪華性能旗艦

目前,REDMI紅米手機已經確認,K80 至尊版、K Pad下平板將在本月發佈。隨着發佈時間的接近,REDMI官方也陸續公布了不少新機細節信息來進行預熱。今天,REDMI品牌總經理王騰重點介紹了REDMI K80 至尊版,並稱其為「豪華性能
消息稱微軟下一代Xbox主機為定製PC,遊戲會向下兼容 - 天天要聞

消息稱微軟下一代Xbox主機為定製PC,遊戲會向下兼容

對於微軟下一代Xbox主機的具體形態,近期出現了多種猜測。其中有消息源表示,下一代 Xbox 主機可能是經過重新包裝的 PC,而非採用定製芯片的傳統主機。不過無論何種情況,最新消息稱新主機都將原生支持運行 Xbox 360 及更新主機的遊戲
飛利浦 Hue Play 洗牆燈發佈:1035 流明,顯色指數大於 80 - 天天要聞

飛利浦 Hue Play 洗牆燈發佈:1035 流明,顯色指數大於 80

IT之家 6 月 17 日消息,飛利浦推出 Hue Play 洗牆燈,作為提升家庭影音娛樂體驗設計的氛圍燈具,產品能夠將多彩光效投射到牆面上。Hue Play 洗牆燈採用 ColorCast 技術,可呈現高度飽和的色彩漸變效果,其 120 度廣角光束可覆蓋大面積牆面。新品亮度為 1035 流明,飛利浦宣稱該數值是普通洗牆燈亮度的兩倍。產品支持 2000...
華為 nova 14 Pro / Ultra 手機獲鴻蒙 HarmonyOS 5.0.1.130 升級 - 天天要聞

華為 nova 14 Pro / Ultra 手機獲鴻蒙 HarmonyOS 5.0.1.130 升級

IT之家 6 月 17 日消息,華為 nova 14 Pro / Ultra 手機今日開啟鴻蒙 HarmonyOS NEXT 5.0.1.130 SP6 版本升級,系統包大小約 5.06GB,優化了部分場景相機的拍照效果和音頻播放效果。▲ IT之家圖賞:華為 nova 14 Ultra 實拍IT之家附華為 nova 14 Pro / Ultra 手機此次更新