阿里雲定義「AI原生數據庫」門檻：一半實例是Agent，一半輸出是Token

2026年01月25日21:30:23 科技 8017

it時報記者郝俊慧

當全行業都在爭搶「ai原生」（ai native）標籤時，「阿里雲數據庫掌門人」李飛飛選擇在這個冬天潑了一盆「冷水」。

在1月20日舉辦的2026阿里雲polardb開發者大會上，面對席捲而來的ai浪潮，阿里雲資深副總裁、數據庫產品事業部負責人李飛飛並沒有急於給自家產品貼上「ai原生」的標籤，「現在喊ai native（ai原生），我認為過早了，因為ai本身還在快速變革中。」

此次polardb大會上，阿里雲發佈了一系列全新的ai能力，包括ai數據湖庫（lakebase）、模型算子化以及面向agent應用開發的託管能力等，「ai就緒的雲原生數據庫」，是polardb對自己現階段的客觀定位。

四大能力為「ai就緒」

「什麼時候一個數據庫才能稱得上ai原生?」在接受媒體採訪時，李飛飛給出了他的兩個判斷標準，「第一，這個數據庫至少一半實例是agent在使用；第二，它的輸出，如果用byte來衡量的話，至少一半byte是token。」

這種冷靜，在當下狂熱的ai技術圈顯得尤為難得。

如果將時鐘撥回兩年前，彼時數據庫與ai的關係，更像是「外掛式」的集成。企業想要構建ai應用，需要數據庫、向量庫、搜索引擎、數據湖等多個系統拼裝組合，數據在不同系統間搬來搬去，既增加了成本，也帶來了數據主權和隱私安全的隱患。

時至今日，從雲原生到ai就緒，polardb在四個方面提升了核心能力。

第一，是構建多模態ai數據湖庫，polardb ai數據湖庫（lakebase）解決方案專為實現「湖庫一體」架構而設計，通過統一存儲與高效分析能力，實現數據庫、數據湖、數據倉庫的有機結合。

第二，是高效融合搜索能力，polardb在sql中深度集成了向量檢索與全文檢索，實現語義理解與關鍵詞匹配的無縫融合，大幅提升複雜查詢場景下的準確率與響應速度。

第三，是模型算子化服務，可支持庫內推理、agent-ready架構及ai長短時記憶機制，使數據庫不僅能存儲和查詢數據，更能直接驅動智能推理與決策。

第四，是面向agent應用開發的後端服務，可以通過supabase多租、serverless封裝提供面向agent應用開發的一體化服務，加速智能體在垂直行業的價值探索。

簡而言之，polardb實現了元數據的統一管理，讓海量結構化、半結構化、非結構化的全模態數據，能夠實現同步融合和處理，

同時，通過模型算子化，polardb將ai推理能力內置為數據庫的標準算子，讓大模型調用與熱數據實時結合，從而實現了token的場景化高效消耗，用戶無需再煩惱「token怎麼用」，而是可以在數據庫內直接完成推理與決策。

在數據生成的地方完成「使命」

「大模型會吞噬一切數據。」採訪中，李飛飛反覆強調，處理數據的能力是走向asi（超級人工智能）的關鍵路徑，「如果說數據是燃料，那麼數據處理能力就是引擎」。

在阿里雲所有產品中，polardb最早提出了接入百鍊（阿里雲大模型服務平台，承載通義千問系列模型）的需求，李飛飛當時聽到了不少質疑的聲音：「數據庫為何要調用百鍊？模型調用不是大模型平台的事嗎？」

不過，polardb依然堅持推動了這個進程，原因很簡單，儘管歷史的「冷數據」和經過微調的「溫數據」最終都會變成模型參數的一部分，但實時產生的「熱數據」卻無法被大模型實時感知。

「如果沒有熱數據的加持，大模型就會產生幻覺……比如我問今天polardb大會有多少人來參會？世界上最厲害的大模型也回答不了，因為這是『熱』的數據。」李飛飛舉例，polardb管着企業最核心的熱數據——交易、訂單、實時業務記錄，如果大模型不能直接在數據產生的地方進行推理，數據價值便會丟失一大半。

這也是前文中提及polardb推出模型算子化服務的底層邏輯，讓大模型的交互在數據最深處發生：熱數據在polardb內直接餵給百鍊模型，大模型可以實時「感知」當下的業務狀態，從而大幅降低延遲，減少幻覺，隱私合規性也大幅提升。

如今，輕舟已過萬重山。李飛飛透露，通過瑤池數據庫產品調用百鍊等服務的token消耗量，短短几個月內增長超過100倍，已是阿里雲內部最大的調用者。

「內存牆幽靈」又回來了

這場技術變革的終局指向何方？答案是agent（智能體）。

數據佐證了這一趨勢，idc中國副總裁兼首席分析師武連峰分享了一組數據：從2025年到2029年，全球agent的數量將從2880萬增長到10億，增長近40倍；而agent的交互次數將從1.2億次暴增到2000多億次。阿里雲內部的調研也顯示，未來新建的數據庫可能80%～90%都是由agent自主創建和使用的。

為了適應這個未來，polardb正在推進面向agent應用開發的後端服務（backend as a service），通過集成supabase、長短記憶管理（long/short-term memory）以及自然語言交互能力，數據庫正在從單純的數據存儲，轉變為智能體的「大腦皮層」，負責記憶、決策與行動。

然而，當大模型吞噬海量數據，agent頻繁調用數據庫時，內存牆的問題再次凸顯。

「內存在過去幾個月漲了30%到40%，接下來可能還要漲2到3倍，」李飛飛坦言，「未來一定是token的世界，而內存牆這個幽靈又回來了。」

李飛飛認為，本輪存儲的超期周期將非常長，與以往純粹由市場需求推動的周期性變化不同，此輪上漲的邏輯是需求爆髮式增長，產能根本無法滿足市場需求，而存儲的漲價會帶動整個鏈條價格上漲，包括智算服務器、通算服務器、內存gpu……，直至ai成為一個成熟產業，市場才會再度進入正常的周期性漲跌。

顯然，這將加速中國企業上雲的速度。隨着自購資源成本的增加，雲服務廠商和ai平台廠商的價值將進一步凸顯。

idc數據顯示，全球範圍內，雲化部署（公有雲、私有雲等雲模式）呈現高速增長態勢，而傳統私有部署基本處於負增長或零增長狀態。武連峰表示，儘管在中國市場，基於本地化需求、數據安全合規和行業特性等原因，私有部署仍有一定增長，不過整體增速仍遠低於雲部署，雲化已成為主流趨勢。

李飛飛假想，未來的手機不再會有幾十個app，而是只有一個入口，所有需求都在數據庫里發生，用戶甚至根本感知不到agent。

這或許就是ai原生的終極形態：人類通過自然語言提出問題和需求，數據庫不僅提供數據，還直接驅動智能推理和決策，最終，一個超級入口agent給出答案。