it時報記者 郝俊慧
當全行業都在爭搶“ai原生”(ai native)標籤時,“阿里雲數據庫掌門人”李飛飛選擇在這個冬天潑了一盆“冷水”。
在1月20日舉辦的2026阿里雲polardb開發者大會上,面對席捲而來的ai浪潮,阿里雲資深副總裁、數據庫產品事業部負責人李飛飛並沒有急於給自家產品貼上“ai原生”的標籤,“現在喊ai native(ai原生),我認為過早了,因為ai本身還在快速變革中。”
此次polardb大會上,阿里雲發布了一系列全新的ai能力,包括ai數據湖庫(lakebase)、模型算子化以及面向agent應用開發的託管能力等,“ai就緒的雲原生數據庫”,是polardb對自己現階段的客觀定位。
四大能力為“ai就緒”
“什麼時候一個數據庫才能稱得上ai原生?”在接受媒體採訪時,李飛飛給出了他的兩個判斷標準,“第一,這個數據庫至少一半實例是agent在使用;第二,它的輸出,如果用byte來衡量的話,至少一半byte是token。”
這種冷靜,在當下狂熱的ai技術圈顯得尤為難得。
如果將時鐘撥回兩年前,彼時數據庫與ai的關係,更像是“外掛式”的集成。企業想要構建ai應用,需要數據庫、向量庫、搜索引擎、數據湖等多個系統拼裝組合,數據在不同系統間搬來搬去,既增加了成本,也帶來了數據主權和隱私安全的隱患。
時至今日,從雲原生到ai就緒,polardb在四個方面提升了核心能力。
第一,是構建多模態ai數據湖庫,polardb ai數據湖庫(lakebase)解決方案專為實現“湖庫一體”架構而設計,通過統一存儲與高效分析能力,實現數據庫、數據湖、數據倉庫的有機結合。
第二,是高效融合搜索能力,polardb在sql中深度集成了向量檢索與全文檢索,實現語義理解與關鍵詞匹配的無縫融合,大幅提升複雜查詢場景下的準確率與響應速度。
第三,是模型算子化服務,可支持庫內推理、agent-ready架構及ai長短時記憶機制,使數據庫不僅能存儲和查詢數據,更能直接驅動智能推理與決策。
第四,是面向agent應用開發的後端服務,可以通過supabase多租、serverless封裝提供面向agent應用開發的一體化服務,加速智能體在垂直行業的價值探索。
簡而言之,polardb實現了元數據的統一管理,讓海量結構化、半結構化、非結構化的全模態數據,能夠實現同步融合和處理,
同時,通過模型算子化,polardb將ai推理能力內置為數據庫的標準算子,讓大模型調用與熱數據實時結合,從而實現了token的場景化高效消耗,用戶無需再煩惱“token怎麼用”,而是可以在數據庫內直接完成推理與決策。

在數據生成的地方完成“使命”
“大模型會吞噬一切數據。”採訪中,李飛飛反覆強調,處理數據的能力是走向asi(超級人工智能)的關鍵路徑,“如果說數據是燃料,那麼數據處理能力就是引擎”。
在阿里雲所有產品中,polardb最早提出了接入百鍊(阿里雲大模型服務平台,承載通義千問系列模型)的需求,李飛飛當時聽到了不少質疑的聲音:“數據庫為何要調用百鍊?模型調用不是大模型平台的事嗎?”
不過,polardb依然堅持推動了這個進程,原因很簡單,儘管歷史的“冷數據”和經過微調的“溫數據”最終都會變成模型參數的一部分,但實時產生的“熱數據”卻無法被大模型實時感知。
“如果沒有熱數據的加持,大模型就會產生幻覺……比如我問今天polardb大會有多少人來參會?世界上最厲害的大模型也回答不了,因為這是‘熱’的數據。”李飛飛舉例,polardb管着企業最核心的熱數據——交易、訂單、實時業務記錄,如果大模型不能直接在數據產生的地方進行推理,數據價值便會丟失一大半。

這也是前文中提及polardb推出模型算子化服務的底層邏輯,讓大模型的交互在數據最深處發生:熱數據在polardb內直接餵給百鍊模型,大模型可以實時“感知”當下的業務狀態,從而大幅降低延遲,減少幻覺,隱私合規性也大幅提升。
如今,輕舟已過萬重山。李飛飛透露,通過瑤池數據庫產品調用百鍊等服務的token消耗量,短短几個月內增長超過100倍,已是阿里雲內部最大的調用者。
“內存牆幽靈”又回來了
這場技術變革的終局指向何方?答案是agent(智能體)。
數據佐證了這一趨勢,idc中國副總裁兼首席分析師武連峰分享了一組數據:從2025年到2029年,全球agent的數量將從2880萬增長到10億,增長近40倍;而agent的交互次數將從1.2億次暴增到2000多億次。阿里雲內部的調研也顯示,未來新建的數據庫可能80%~90%都是由agent自主創建和使用的。
為了適應這個未來,polardb正在推進面向agent應用開發的後端服務(backend as a service),通過集成supabase、長短記憶管理(long/short-term memory)以及自然語言交互能力,數據庫正在從單純的數據存儲,轉變為智能體的“大腦皮層”,負責記憶、決策與行動。
然而,當大模型吞噬海量數據,agent頻繁調用數據庫時,內存牆的問題再次凸顯。
“內存在過去幾個月漲了30%到40%,接下來可能還要漲2到3倍,”李飛飛坦言,“未來一定是token的世界,而內存牆這個幽靈又回來了。”
李飛飛認為,本輪存儲的超期周期將非常長,與以往純粹由市場需求推動的周期性變化不同,此輪上漲的邏輯是需求爆髮式增長,產能根本無法滿足市場需求,而存儲的漲價會帶動整個鏈條價格上漲,包括智算服務器、通算服務器、內存gpu……,直至ai成為一個成熟產業,市場才會再度進入正常的周期性漲跌。
顯然,這將加速中國企業上雲的速度。隨着自購資源成本的增加,雲服務廠商和ai平台廠商的價值將進一步凸顯。
idc數據顯示,全球範圍內,雲化部署(公有雲、私有雲等雲模式)呈現高速增長態勢,而傳統私有部署基本處於負增長或零增長狀態。武連峰表示,儘管在中國市場,基於本地化需求、數據安全合規和行業特性等原因,私有部署仍有一定增長,不過整體增速仍遠低於雲部署,雲化已成為主流趨勢。
李飛飛假想,未來的手機不再會有幾十個app,而是只有一個入口,所有需求都在數據庫里發生,用戶甚至根本感知不到agent。
這或許就是ai原生的終極形態:人類通過自然語言提出問題和需求,數據庫不僅提供數據,還直接驅動智能推理和決策,最終,一個超級入口agent給出答案。