it時報記者 郝俊慧
當全行業都在爭搶「ai原生」(ai native)標籤時,「阿里雲數據庫掌門人」李飛飛選擇在這個冬天潑了一盆「冷水」。
在1月20日舉辦的2026阿里雲polardb開發者大會上,面對席捲而來的ai浪潮,阿里雲資深副總裁、數據庫產品事業部負責人李飛飛並沒有急於給自家產品貼上「ai原生」的標籤,「現在喊ai native(ai原生),我認為過早了,因為ai本身還在快速變革中。」
此次polardb大會上,阿里雲發佈了一系列全新的ai能力,包括ai數據湖庫(lakebase)、模型算子化以及面向agent應用開發的託管能力等,「ai就緒的雲原生數據庫」,是polardb對自己現階段的客觀定位。
四大能力為「ai就緒」
「什麼時候一個數據庫才能稱得上ai原生?」在接受媒體採訪時,李飛飛給出了他的兩個判斷標準,「第一,這個數據庫至少一半實例是agent在使用;第二,它的輸出,如果用byte來衡量的話,至少一半byte是token。」
這種冷靜,在當下狂熱的ai技術圈顯得尤為難得。
如果將時鐘撥回兩年前,彼時數據庫與ai的關係,更像是「外掛式」的集成。企業想要構建ai應用,需要數據庫、向量庫、搜索引擎、數據湖等多個系統拼裝組合,數據在不同系統間搬來搬去,既增加了成本,也帶來了數據主權和隱私安全的隱患。
時至今日,從雲原生到ai就緒,polardb在四個方面提升了核心能力。
第一,是構建多模態ai數據湖庫,polardb ai數據湖庫(lakebase)解決方案專為實現「湖庫一體」架構而設計,通過統一存儲與高效分析能力,實現數據庫、數據湖、數據倉庫的有機結合。
第二,是高效融合搜索能力,polardb在sql中深度集成了向量檢索與全文檢索,實現語義理解與關鍵詞匹配的無縫融合,大幅提升複雜查詢場景下的準確率與響應速度。
第三,是模型算子化服務,可支持庫內推理、agent-ready架構及ai長短時記憶機制,使數據庫不僅能存儲和查詢數據,更能直接驅動智能推理與決策。
第四,是面向agent應用開發的後端服務,可以通過supabase多租、serverless封裝提供面向agent應用開發的一體化服務,加速智能體在垂直行業的價值探索。
簡而言之,polardb實現了元數據的統一管理,讓海量結構化、半結構化、非結構化的全模態數據,能夠實現同步融合和處理,
同時,通過模型算子化,polardb將ai推理能力內置為數據庫的標準算子,讓大模型調用與熱數據實時結合,從而實現了token的場景化高效消耗,用戶無需再煩惱「token怎麼用」,而是可以在數據庫內直接完成推理與決策。

在數據生成的地方完成「使命」
「大模型會吞噬一切數據。」採訪中,李飛飛反覆強調,處理數據的能力是走向asi(超級人工智能)的關鍵路徑,「如果說數據是燃料,那麼數據處理能力就是引擎」。
在阿里雲所有產品中,polardb最早提出了接入百鍊(阿里雲大模型服務平台,承載通義千問系列模型)的需求,李飛飛當時聽到了不少質疑的聲音:「數據庫為何要調用百鍊?模型調用不是大模型平台的事嗎?」
不過,polardb依然堅持推動了這個進程,原因很簡單,儘管歷史的「冷數據」和經過微調的「溫數據」最終都會變成模型參數的一部分,但實時產生的「熱數據」卻無法被大模型實時感知。
「如果沒有熱數據的加持,大模型就會產生幻覺……比如我問今天polardb大會有多少人來參會?世界上最厲害的大模型也回答不了,因為這是『熱』的數據。」李飛飛舉例,polardb管着企業最核心的熱數據——交易、訂單、實時業務記錄,如果大模型不能直接在數據產生的地方進行推理,數據價值便會丟失一大半。

這也是前文中提及polardb推出模型算子化服務的底層邏輯,讓大模型的交互在數據最深處發生:熱數據在polardb內直接餵給百鍊模型,大模型可以實時「感知」當下的業務狀態,從而大幅降低延遲,減少幻覺,隱私合規性也大幅提升。
如今,輕舟已過萬重山。李飛飛透露,通過瑤池數據庫產品調用百鍊等服務的token消耗量,短短几個月內增長超過100倍,已是阿里雲內部最大的調用者。
「內存牆幽靈」又回來了
這場技術變革的終局指向何方?答案是agent(智能體)。
數據佐證了這一趨勢,idc中國副總裁兼首席分析師武連峰分享了一組數據:從2025年到2029年,全球agent的數量將從2880萬增長到10億,增長近40倍;而agent的交互次數將從1.2億次暴增到2000多億次。阿里雲內部的調研也顯示,未來新建的數據庫可能80%~90%都是由agent自主創建和使用的。
為了適應這個未來,polardb正在推進面向agent應用開發的後端服務(backend as a service),通過集成supabase、長短記憶管理(long/short-term memory)以及自然語言交互能力,數據庫正在從單純的數據存儲,轉變為智能體的「大腦皮層」,負責記憶、決策與行動。
然而,當大模型吞噬海量數據,agent頻繁調用數據庫時,內存牆的問題再次凸顯。
「內存在過去幾個月漲了30%到40%,接下來可能還要漲2到3倍,」李飛飛坦言,「未來一定是token的世界,而內存牆這個幽靈又回來了。」
李飛飛認為,本輪存儲的超期周期將非常長,與以往純粹由市場需求推動的周期性變化不同,此輪上漲的邏輯是需求爆髮式增長,產能根本無法滿足市場需求,而存儲的漲價會帶動整個鏈條價格上漲,包括智算服務器、通算服務器、內存gpu……,直至ai成為一個成熟產業,市場才會再度進入正常的周期性漲跌。
顯然,這將加速中國企業上雲的速度。隨着自購資源成本的增加,雲服務廠商和ai平台廠商的價值將進一步凸顯。
idc數據顯示,全球範圍內,雲化部署(公有雲、私有雲等雲模式)呈現高速增長態勢,而傳統私有部署基本處於負增長或零增長狀態。武連峰表示,儘管在中國市場,基於本地化需求、數據安全合規和行業特性等原因,私有部署仍有一定增長,不過整體增速仍遠低於雲部署,雲化已成為主流趨勢。
李飛飛假想,未來的手機不再會有幾十個app,而是只有一個入口,所有需求都在數據庫里發生,用戶甚至根本感知不到agent。
這或許就是ai原生的終極形態:人類通過自然語言提出問題和需求,數據庫不僅提供數據,還直接驅動智能推理和決策,最終,一個超級入口agent給出答案。