阿里云定义“AI原生数据库”门槛：一半实例是Agent，一半输出是Token

分类：科技

浏览数：8017

2026-01-25

it时报记者郝俊慧

当全行业都在争抢“ai原生”（ai native）标签时，“阿里云数据库掌门人”李飞飞选择在这个冬天泼了一盆“冷水”。

在1月20日举办的2026阿里云polardb开发者大会上，面对席卷而来的ai浪潮，阿里云资深副总裁、数据库产品事业部负责人李飞飞并没有急于给自家产品贴上“ai原生”的标签，“现在喊ai native（ai原生），我认为过早了，因为ai本身还在快速变革中。”

此次polardb大会上，阿里云发布了一系列全新的ai能力，包括ai数据湖库（lakebase）、模型算子化以及面向agent应用开发的托管能力等，“ai就绪的云原生数据库”，是polardb对自己现阶段的客观定位。

四大能力为“ai就绪”

“什么时候一个数据库才能称得上ai原生?”在接受媒体采访时，李飞飞给出了他的两个判断标准，“第一，这个数据库至少一半实例是agent在使用；第二，它的输出，如果用byte来衡量的话，至少一半byte是token。”

这种冷静，在当下狂热的ai技术圈显得尤为难得。

如果将时钟拨回两年前，彼时数据库与ai的关系，更像是“外挂式”的集成。企业想要构建ai应用，需要数据库、向量库、搜索引擎、数据湖等多个系统拼装组合，数据在不同系统间搬来搬去，既增加了成本，也带来了数据主权和隐私安全的隐患。

时至今日，从云原生到ai就绪，polardb在四个方面提升了核心能力。

第一，是构建多模态ai数据湖库，polardb ai数据湖库（lakebase）解决方案专为实现“湖库一体”架构而设计，通过统一存储与高效分析能力，实现数据库、数据湖、数据仓库的有机结合。

第二，是高效融合搜索能力，polardb在sql中深度集成了向量检索与全文检索，实现语义理解与关键词匹配的无缝融合，大幅提升复杂查询场景下的准确率与响应速度。

第三，是模型算子化服务，可支持库内推理、agent-ready架构及ai长短时记忆机制，使数据库不仅能存储和查询数据，更能直接驱动智能推理与决策。

第四，是面向agent应用开发的后端服务，可以通过supabase多租、serverless封装提供面向agent应用开发的一体化服务，加速智能体在垂直行业的价值探索。

简而言之，polardb实现了元数据的统一管理，让海量结构化、半结构化、非结构化的全模态数据，能够实现同步融合和处理，

同时，通过模型算子化，polardb将ai推理能力内置为数据库的标准算子，让大模型调用与热数据实时结合，从而实现了token的场景化高效消耗，用户无需再烦恼“token怎么用”，而是可以在数据库内直接完成推理与决策。

在数据生成的地方完成“使命”

“大模型会吞噬一切数据。”采访中，李飞飞反复强调，处理数据的能力是走向asi（超级人工智能）的关键路径，“如果说数据是燃料，那么数据处理能力就是引擎”。

在阿里云所有产品中，polardb最早提出了接入百炼（阿里云大模型服务平台，承载通义千问系列模型）的需求，李飞飞当时听到了不少质疑的声音：“数据库为何要调用百炼？模型调用不是大模型平台的事吗？”

不过，polardb依然坚持推动了这个进程，原因很简单，尽管历史的“冷数据”和经过微调的“温数据”最终都会变成模型参数的一部分，但实时产生的“热数据”却无法被大模型实时感知。

“如果没有热数据的加持，大模型就会产生幻觉……比如我问今天polardb大会有多少人来参会？世界上最厉害的大模型也回答不了，因为这是‘热’的数据。”李飞飞举例，polardb管着企业最核心的热数据——交易、订单、实时业务记录，如果大模型不能直接在数据产生的地方进行推理，数据价值便会丢失一大半。

这也是前文中提及polardb推出模型算子化服务的底层逻辑，让大模型的交互在数据最深处发生：热数据在polardb内直接喂给百炼模型，大模型可以实时“感知”当下的业务状态，从而大幅降低延迟，减少幻觉，隐私合规性也大幅提升。

如今，轻舟已过万重山。李飞飞透露，通过瑶池数据库产品调用百炼等服务的token消耗量，短短几个月内增长超过100倍，已是阿里云内部最大的调用者。

“内存墙幽灵”又回来了

这场技术变革的终局指向何方？答案是agent（智能体）。

数据佐证了这一趋势，idc中国副总裁兼首席分析师武连峰分享了一组数据：从2025年到2029年，全球agent的数量将从2880万增长到10亿，增长近40倍；而agent的交互次数将从1.2亿次暴增到2000多亿次。阿里云内部的调研也显示，未来新建的数据库可能80%～90%都是由agent自主创建和使用的。

为了适应这个未来，polardb正在推进面向agent应用开发的后端服务（backend as a service），通过集成supabase、长短记忆管理（long/short-term memory）以及自然语言交互能力，数据库正在从单纯的数据存储，转变为智能体的“大脑皮层”，负责记忆、决策与行动。

然而，当大模型吞噬海量数据，agent频繁调用数据库时，内存墙的问题再次凸显。

“内存在过去几个月涨了30%到40%，接下来可能还要涨2到3倍，”李飞飞坦言，“未来一定是token的世界，而内存墙这个幽灵又回来了。”

李飞飞认为，本轮存储的超期周期将非常长，与以往纯粹由市场需求推动的周期性变化不同，此轮上涨的逻辑是需求爆发式增长，产能根本无法满足市场需求，而存储的涨价会带动整个链条价格上涨，包括智算服务器、通算服务器、内存gpu……，直至ai成为一个成熟产业，市场才会再度进入正常的周期性涨跌。

显然，这将加速中国企业上云的速度。随着自购资源成本的增加，云服务厂商和ai平台厂商的价值将进一步凸显。

idc数据显示，全球范围内，云化部署（公有云、私有云等云模式）呈现高速增长态势，而传统私有部署基本处于负增长或零增长状态。武连峰表示，尽管在中国市场，基于本地化需求、数据安全合规和行业特性等原因，私有部署仍有一定增长，不过整体增速仍远低于云部署，云化已成为主流趋势。

李飞飞假想，未来的手机不再会有几十个app，而是只有一个入口，所有需求都在数据库里发生，用户甚至根本感知不到agent。

这或许就是ai原生的终极形态：人类通过自然语言提出问题和需求，数据库不仅提供数据，还直接驱动智能推理和决策，最终，一个超级入口agent给出答案。

科技分类资讯推荐