it时报记者 郝俊慧
当全行业都在争抢“ai原生”(ai native)标签时,“阿里云数据库掌门人”李飞飞选择在这个冬天泼了一盆“冷水”。
在1月20日举办的2026阿里云polardb开发者大会上,面对席卷而来的ai浪潮,阿里云资深副总裁、数据库产品事业部负责人李飞飞并没有急于给自家产品贴上“ai原生”的标签,“现在喊ai native(ai原生),我认为过早了,因为ai本身还在快速变革中。”
此次polardb大会上,阿里云发布了一系列全新的ai能力,包括ai数据湖库(lakebase)、模型算子化以及面向agent应用开发的托管能力等,“ai就绪的云原生数据库”,是polardb对自己现阶段的客观定位。
四大能力为“ai就绪”
“什么时候一个数据库才能称得上ai原生?”在接受媒体采访时,李飞飞给出了他的两个判断标准,“第一,这个数据库至少一半实例是agent在使用;第二,它的输出,如果用byte来衡量的话,至少一半byte是token。”
这种冷静,在当下狂热的ai技术圈显得尤为难得。
如果将时钟拨回两年前,彼时数据库与ai的关系,更像是“外挂式”的集成。企业想要构建ai应用,需要数据库、向量库、搜索引擎、数据湖等多个系统拼装组合,数据在不同系统间搬来搬去,既增加了成本,也带来了数据主权和隐私安全的隐患。
时至今日,从云原生到ai就绪,polardb在四个方面提升了核心能力。
第一,是构建多模态ai数据湖库,polardb ai数据湖库(lakebase)解决方案专为实现“湖库一体”架构而设计,通过统一存储与高效分析能力,实现数据库、数据湖、数据仓库的有机结合。
第二,是高效融合搜索能力,polardb在sql中深度集成了向量检索与全文检索,实现语义理解与关键词匹配的无缝融合,大幅提升复杂查询场景下的准确率与响应速度。
第三,是模型算子化服务,可支持库内推理、agent-ready架构及ai长短时记忆机制,使数据库不仅能存储和查询数据,更能直接驱动智能推理与决策。
第四,是面向agent应用开发的后端服务,可以通过supabase多租、serverless封装提供面向agent应用开发的一体化服务,加速智能体在垂直行业的价值探索。
简而言之,polardb实现了元数据的统一管理,让海量结构化、半结构化、非结构化的全模态数据,能够实现同步融合和处理,
同时,通过模型算子化,polardb将ai推理能力内置为数据库的标准算子,让大模型调用与热数据实时结合,从而实现了token的场景化高效消耗,用户无需再烦恼“token怎么用”,而是可以在数据库内直接完成推理与决策。
在数据生成的地方完成“使命”
“大模型会吞噬一切数据。”采访中,李飞飞反复强调,处理数据的能力是走向asi(超级人工智能)的关键路径,“如果说数据是燃料,那么数据处理能力就是引擎”。
在阿里云所有产品中,polardb最早提出了接入百炼(阿里云大模型服务平台,承载通义千问系列模型)的需求,李飞飞当时听到了不少质疑的声音:“数据库为何要调用百炼?模型调用不是大模型平台的事吗?”
不过,polardb依然坚持推动了这个进程,原因很简单,尽管历史的“冷数据”和经过微调的“温数据”最终都会变成模型参数的一部分,但实时产生的“热数据”却无法被大模型实时感知。
“如果没有热数据的加持,大模型就会产生幻觉……比如我问今天polardb大会有多少人来参会?世界上最厉害的大模型也回答不了,因为这是‘热’的数据。”李飞飞举例,polardb管着企业最核心的热数据——交易、订单、实时业务记录,如果大模型不能直接在数据产生的地方进行推理,数据价值便会丢失一大半。
这也是前文中提及polardb推出模型算子化服务的底层逻辑,让大模型的交互在数据最深处发生:热数据在polardb内直接喂给百炼模型,大模型可以实时“感知”当下的业务状态,从而大幅降低延迟,减少幻觉,隐私合规性也大幅提升。
如今,轻舟已过万重山。李飞飞透露,通过瑶池数据库产品调用百炼等服务的token消耗量,短短几个月内增长超过100倍,已是阿里云内部最大的调用者。
“内存墙幽灵”又回来了
这场技术变革的终局指向何方?答案是agent(智能体)。
数据佐证了这一趋势,idc中国副总裁兼首席分析师武连峰分享了一组数据:从2025年到2029年,全球agent的数量将从2880万增长到10亿,增长近40倍;而agent的交互次数将从1.2亿次暴增到2000多亿次。阿里云内部的调研也显示,未来新建的数据库可能80%~90%都是由agent自主创建和使用的。
为了适应这个未来,polardb正在推进面向agent应用开发的后端服务(backend as a service),通过集成supabase、长短记忆管理(long/short-term memory)以及自然语言交互能力,数据库正在从单纯的数据存储,转变为智能体的“大脑皮层”,负责记忆、决策与行动。
然而,当大模型吞噬海量数据,agent频繁调用数据库时,内存墙的问题再次凸显。
“内存在过去几个月涨了30%到40%,接下来可能还要涨2到3倍,”李飞飞坦言,“未来一定是token的世界,而内存墙这个幽灵又回来了。”
李飞飞认为,本轮存储的超期周期将非常长,与以往纯粹由市场需求推动的周期性变化不同,此轮上涨的逻辑是需求爆发式增长,产能根本无法满足市场需求,而存储的涨价会带动整个链条价格上涨,包括智算服务器、通算服务器、内存gpu……,直至ai成为一个成熟产业,市场才会再度进入正常的周期性涨跌。
显然,这将加速中国企业上云的速度。随着自购资源成本的增加,云服务厂商和ai平台厂商的价值将进一步凸显。
idc数据显示,全球范围内,云化部署(公有云、私有云等云模式)呈现高速增长态势,而传统私有部署基本处于负增长或零增长状态。武连峰表示,尽管在中国市场,基于本地化需求、数据安全合规和行业特性等原因,私有部署仍有一定增长,不过整体增速仍远低于云部署,云化已成为主流趋势。
李飞飞假想,未来的手机不再会有几十个app,而是只有一个入口,所有需求都在数据库里发生,用户甚至根本感知不到agent。
这或许就是ai原生的终极形态:人类通过自然语言提出问题和需求,数据库不仅提供数据,还直接驱动智能推理和决策,最终,一个超级入口agent给出答案。