
2026年第一波“存儲成本暴擊”到來
作者/ IT時報 郝俊慧
編輯/ 潘少穎 孫妍
1月26日,當三星電子、SK海力士相繼宣布2026年第一季度的NAND Flash供應合約價直接翻倍時,全球科技行業意識到,由AI驅動的2026年第一波“成本暴擊”已經到來。
最近,阿里雲資深副總裁、數據庫產品事業部負責人李飛飛在PolarDB開發者大會上便曾給出一個更為激進的判斷:“內存接下來可能還要漲兩到三倍。”
“大模型正在吞噬一切數據”,李飛飛坦言,未來一定是Token的世界,而內存牆這個“幽靈”又回來了。
漲價周期遠超預期
這輪內存漲價的幅度和持續時間,遠超市場預期。
隨着DeepSeek-R1等推理模型和Agent(智能體)應用的爆發,AI對“熱數據”的依賴達到前所未有的高度。大模型不再只是離線訓練的產物,它需要實時“記憶”海量的上下文信息。
“大模型不保存事實,只保存統計規律,而數據庫需要保存事實。”李飛飛指出,像“今天大會來了多少人”這樣的實時熱數據,必須在數據庫中供模型實時調用,否則AI就會產生幻覺。這意味着,每一路AI推理的背後,都對應着巨大的存儲消耗。
然而,供給端的瓶頸卻在收緊。據外媒報道,三星、SK海力士和美光這三大巨頭控制了全球近95%的DRAM(動態隨機存取存儲器)產量,目前正將產能全面轉向高利潤的HBM(高帶寬存儲器),以滿足OpenAI等巨頭的超級算力項目需求。SK海力士甚至表示,其HBM產能已在2026年售罄。
這場“豪門盛宴”直接擠壓了傳統DRAM的產能,導致普通企業面臨嚴重的供應短缺。
在1月27日舉行的WPS AI協同辦公上海峰會上,中金公司研究部執行總經理於鍾海也指出,2026年將是“持續學習年”,模型需要不斷更新記憶。
模型“記憶力”的增強意味着將進一步推高對數據存儲和處理的硬件要求。更關鍵的是,存儲廠商對擴產極為謹慎,要知道,2023年之前的下行周期中存儲價格持續下跌,三星曾創下14年來利潤最低點。一份SK海力士內部文件顯示,新增產能要到2028年才可能釋放。
“硬件通脹”重構企業AI戰略
面對硬件成本的指數級上升,企業的AI戰略正在經歷重構。
“有些企業在2023、2024年甚至有千萬預算,在本地部署大模型,事後來看這些投資可能都沒有產生正面收益。”金山辦公助理總裁朱熠鍔在接受採訪時表示。
對於大多數企業而言,自建模型不僅面臨著硬件成本的“通脹”,還面臨著技術的快速貶值。
於鍾海列舉了一組數據:即便是像GPT-4o這樣的一代“神模”,在發布12個月後,用戶的留存率也僅剩15%左右。如果企業花費巨資購買GPU和內存去訓練一個私有模型,很可能“模型剛訓好,基座模型已經升級了”。
“行業大模型在多數B端客戶場景里,是一個偽命題。”朱熠鍔直言。在硬件成本高企的當下,企業如果繼續試圖通過堆算力、堆內存來“卷模型”,無異於在通脹周期里持有貶值資產。
對於AI的應用者而言,數據正在成為企業唯一可持續的競爭優勢。
“模型不是萬能葯,數據才是護城河。”朱熠鍔強調,既然通用大模型的能力已經足夠強大且廉價,企業就應該停止重複“造輪子”,轉而將昂貴的存儲資源用於處理真正核心的“私域知識”。

以醫藥行業為例,一份幾百頁的臨床研究報告,過去需要博士團隊耗時一個月處理,現在通過精細化的數據治理和Agent協作,一周內即可完成,準確率高達90%。
這種通過“工程化”手段提升數據密度的做法,實際上是在變相抵抗硬件成本的上漲——用更少的Token和內存,產出更高價值的業務結果。
中國企業的雲原生將加速
當然,對於通用大模型廠商而言,內存比金子還貴,是挑戰也是機遇,中國企業對雲原生的接受正在提速。
面對單體硬件成本的暴漲,通過構建超大規模的遠程內存池,實現多租戶共享復用,成為對抗漲價的有效技術路徑。
李飛飛透露,通過瑤池數據庫產品調用百鍊等服務的Token消耗量,短短几個月內增長超過100倍,已成為阿里雲內部最大的調用者。
“本輪存儲的超級周期將非常長。”李飛飛認為,與以往純粹由市場需求推動的周期性變化不同,此輪上漲的邏輯是需求爆髮式增長,產能根本無法滿足市場需求,而存儲的漲價會帶動整個鏈條價格上漲,包括智算服務器、通算服務器、內存GPU……直至AI成為一個成熟產業,市場才會再度進入正常的周期性漲跌。

隨着自購資源成本的增加,雲服務廠商和AI平台廠商的價值將進一步凸顯。
在這個新周期里,企業的競爭力將不再取決於誰買了更多的算力和存儲,而在於誰能通過更精細的數據治理和更先進的雲架構,讓客戶能更好、更便宜地使用AI。
排版/ 季嘉穎
圖片/ 東方IC unsplash