AI记忆无限膨胀?SEDM框架用可验证写入精准筛选

2025年11月17日20:30:35 财经 9933

Gradient 团队近期开展了一项研究,这源于一个很现实的问题:随着大模型和多智能体系统(Multi-Agent System, MAS)的发展,系统在长时间运行过程中会不断产生大量交互记录和历史信息。举个例子,当一个智能体与环境互动、与其他智能体协作时,它每天都在“积累记忆”。这些记忆本来是很宝贵的,但如果管理不好,就会像人类的“碎片化记忆”一样,越堆越乱,甚至产生噪声,导致系统效率变低、推理准确率下降和成本增加。

AI记忆无限膨胀?SEDM框架用可验证写入精准筛选 - 天天要闻

传统做法主要依赖两种手段:第一是向量检索,通过相似度找“相关记忆”;第二是分层存储,以分级方式管理信息。这些方法在初期确实有效,但在复杂、长期、多任务场景里,往往会遇到三个问题:

  1. 噪声累积:有价值和没价值的信息混在一起,检索时“好记忆”被“坏记忆”淹没。
  2. 存储失控:记忆库无限膨胀,推理时上下文越来越长,导致算力、金钱成本和响应时延上升。
  3. 跨领域泛化不足:一个任务域的经验,难以稳健迁移到另一个任务域。

为此,Gradient 团队提出了 SEDM(可扩展自进化分布式记忆框架),希望让“记忆”从被动仓库变成可以主动进化、自我优化、可审计的核心部件。

Gradient 团队的核心贡献,是把“记忆”设计成了一个可验证、自进化的分布式系统。具体来说,SEDM有三个创新点:

可验证写入(Verifiable Write Admission)

每一条候选记忆在进入系统之前,都会经历一次可复现的“实验验证”。Gradient 团队将其封装进自包含执行上下文(Self-Contained Execution Context, SCEC),该上下文支持环境无关的回放与离线验证,并记录哈希、版本与指纹信息,形成可审计的证据链。随后进行A/B对照实验:使用这条记忆与不使用时的差异,综合评估其对准确率、延迟(响应时延)和Token开销的影响。只有综合评分为正的“高质量经验”才能写入记忆库并获得初始权重。

自调度记忆控制器(Self-Scheduling Controller)

SEDM不会让记忆库无限扩张,而是设计了一个自我调度的机制。它会根据经验的“实用性权重”和语义相似度,来动态决定哪些记忆应该被调用,哪些应该逐渐淘汰或合并。比如,多次证明无效的记忆会被自动“衰减”,而经常有帮助的经验会被提升权重,甚至抽象成更通用的知识。

跨领域知识扩散(Cross-Domain Knowledge Diffusion)

SEDM不仅能在单一任务中发挥作用,还能把一个任务里学到的知识,抽象成通用形式(从specific到general),再迁移到另一个任务里。比如,Gradient 团队观察到,从事实验证(FEVER)中蒸馏的知识可以显著帮助多跳推理(HotpotQA)。

整体来看,SEDM让记忆从被动存储变成主动演化的系统组件:在提升推理准确率的同时,有效控制Token开销与响应时延,增强了系统的可持续性。

Gradient 团队的论文在送审过程中,几位审稿人都给出了积极的反馈。有人评价说:

  • “这项工作把‘记忆’从传统的静态仓库,转化为一个可验证、可进化的组件,这是一种全新的思路。”
  • “SEDM提出的AB验证机制,提供了可审计的证据链,避免了黑箱操作,这是非常有价值的。”
  • “跨任务迁移的实验结果令人印象深刻,说明SEDM有潜力成为长期多智能体系统的基础设施。”

Gradient 团队收到这些审稿意见之后,感受到学界对这类研究方向的认可,也更坚定了Gradient 团队继续探索智能体系统记忆演化的信心。

从3到5年的视角,SEDM的应用可以从三个方向落地:

人工智能助手

面向个人与企业的智能助手,长期陪伴型助手需要稳健的长期记忆管理,SEDM可在不牺牲效率的前提下,保留用户偏好与关键知识点,降低上下文冗余与响应时延。

长上下文专业任务领域助手

企业级知识库问答、代码协作与演进式Copilot、临床与科研辅助决策(Clinical/Research Decision Support)。在这些对长上下文和持续推理敏感的场景中,SEDM通过自调度与可验证写入筛选关键记忆,控制上下文窗口和时延,提升准确性与可解释性。

科研和知识管理

科研工作者每天都会接触海量论文和实验数据。SEDM可以作为“科研记忆库”,自动筛选高价值知识、避免重复劳动,并将已验证的知识以通用片段形式迁移到新领域,加速跨学科探索。

Gradient 团队当初研究记忆自进化这个方向,在调研测试了一些现有的工作时,发现随着任务的不断执行,系统的“记忆库”膨胀得特别快,并且存在大量冗余又琐碎的细节。因此团队里的成员haoran就提出,为什么不能让记忆库像人类一样,学会根据记忆的重要性做出取舍。这推动了Gradient 团队实现可验证写入和自调度记忆控制器。此后,Gradient 团队更像是在旁观——不告诉AI记什么,而是用证据和规则看它自己学会“记与忘”。

另外,Gradient 团队成员跨越多个国家和时区,常常是凌晨一点还在开会讨论实验结果。虽然辛苦,但大家因为共同的热情而坚持,这也让Bill Shi觉得非常难忘。

接下来Gradient 团队有三方面计划:

更大规模的实测:

目前SEDM主要在公开数据集上做验证,Gradient 团队希望将它推广到更复杂的真实场景,比如企业级知识库管理、大规模代码开发项目助手等,测试它在大规模应用下的稳定性。

结合推理与规划:

Gradient 团队认为记忆不仅是“信息仓库”,还应该能参与到推理和规划中。未来Gradient 团队计划把SEDM和强化学习、推理模型结合起来,让记忆在决策过程中发挥更主动的作用。

开放生态建设:

Gradient 团队也计划逐步开源SEDM的框架,邀请更多研究者和开发者参与进来,共同推动这个方向的发展。

Bill Shi想补充的一点是,SEDM不仅仅是一个技术成果,更是一种理念的体现:人工智能系统需要“可持续性”。在AI快速发展的今天,Gradient 团队常常追求更大的模型、更强的算力,但如果没有好的机制去管理知识和记忆,系统就会不可避免地陷入低效甚至崩溃。SEDM正是Gradient 团队在探索“如何让AI长期高效工作”的一种尝试。

Gradient 团队相信,未来的AI一定是“有记忆、有演化能力”的,而SEDM只是这个方向上的第一步。

本研究由Gradient 团队共同完成。核心架构与系统实现、实验设计与结果复核、数据处理与工具链建设均由haoran,jiacong和zhangke等团队成员协同推进。

财经分类资讯推荐

4月30日人社部发布会召开,涉及到社保和养老金,具体有哪些内容 - 天天要闻

4月30日人社部发布会召开,涉及到社保和养老金,具体有哪些内容

人力资源和社会保障部,组织召开的第一季度例行新闻发布会。在新闻发布会当中带来了,关于社保和养老金方面的一些内容,那么我们具体来了解一下究竟有哪些内容,这些内容对于我们个人来说会产生一个什么样的影响呢?养老保险的参保人数不断提高根据人社部的例行新闻发布会当中指出,截止到2026年的第1季度末,养老保险的参...
中兴三星全球专利纠纷持续 知识产权保护需凝聚国际共识 - 天天要闻

中兴三星全球专利纠纷持续 知识产权保护需凝聚国际共识

近期,中兴通讯与三星电子围绕无线通信标准必要专利(SEP)许可的全球性纠纷迎来多项关键司法裁决。当地时间4月30日,德国慕尼黑第一地区法院就双方专利侵权纠纷作出当庭判决,中兴通讯在主诉与反诉案件中同时胜出,成功获得针对三星的德国禁令。而此前英国高等法院作出的一
巴菲特,最新发声!接班人,股东大会观点来了 - 天天要闻

巴菲特,最新发声!接班人,股东大会观点来了

【导读】伯克希尔·哈撒韦股东大会要点直击中国基金报记者 李智当地时间5月2日,伯克希尔·哈撒韦股东大会在美国奥马哈召开。本次大会由格雷格·阿贝尔接任CEO后首次独立主持,“股神”巴菲特则以董事会主席身份列席台下。在今年的大会上,阿贝尔探讨了AI战略、网络安全、能源转型、股票回购等诸多话题,宣告伯克希尔正式进...
早读丨广东多项交通数据创历史新高;张雪机车再夺冠军 - 天天要闻

早读丨广东多项交通数据创历史新高;张雪机车再夺冠军

◆“首展”添彩、国潮涌动,广东4A级及以上景区单日接待游客394.2万人次。详情--> “五一”假期“逛吃”指南:广交会客商与市民共享全城消费热力。详情--> ◆常规赛第六轮精彩纷呈,多场对决战至最后时刻。详情--> 粤超第二轮先赛五场:梅州反客为主大胜潮州,潮语电影《给阿嬷的情书》片花亮相汕头主场。详情--> 粤超、粤...
低价抢市场害苦科陆电子,连续5年亏损靠大股东“输血续命” - 天天要闻

低价抢市场害苦科陆电子,连续5年亏损靠大股东“输血续命”

图源:公司官网本报(chinatimes.net.cn)记者胡雅文 北京报道深圳市科陆电子科技股份有限公司(下称“科陆电子”,002121.SZ)迟迟未能实现盈利。近日,科陆电子交出了被美的集团收购后的第二份年报,营收63.1亿元创下历史新高,净利润却连续第5年亏损。截至2025年末,其资产负债率高达95.15%。进入2026年,一季度再亏0.4...