智东西 16小时前
亚马逊Agent克服遗忘的“秘诀”,被中国团队掌握,让大模型遗忘率趋近于0
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

智东西

作者 | 江宇

编辑 | 漠影

AI 很聪明,但记性很差。

你大概也遇到过这样的场景:第一轮对话里告诉智能客服 " 我对海鲜过敏 ",聊到第十轮,它却依然热情推荐海鲜自助。

在企业服务里,用户换一个渠道、换一个 Agent,之前提供的信息就像从没出现过一样,用户体验被 "AI 的健忘症 " 一再打断。

对于正在大规模 " 上云 " 和 " 上 AI" 的企业来说,这是每天都会撞上的真实业务问题:模型上下文窗口有限,多 Agent 之间形成 " 记忆孤岛 ",语义歧义和知识遗忘在长链路服务中被不断放大。

如果不能让 AI 持续记住用户、记住业务现场,再强的大模型也很难扛起真实的服务指标。

这种痛点在全球云厂商的实践中已经被验证。亚马逊云科技在今年的 Agentic AI 基础设施实践经验系列中专门拿出一篇,讨论大模型在 " 记忆 " 上的先天缺陷,并提出要在 Agent 体系里单独建设记忆模块,区分短期记忆和长期记忆,将 " 记忆 " 从附属能力升级为 Agentic AI 基础设施的一部分。

亚马逊 AWS 官方博客

在海外巨头已经将 " 记忆系统 " 提升到基础设施层的同时,国内也开始出现以记忆为主线构建产品和架构的团队。

红熊 AI 便是其中之一。公司成立于 2024 年,围绕多模态大模型与记忆科学开展研发,并将这些能力用于为企业提供智能客服、营销自动化与 AI 智能体服务。

12 月 1 日,红熊 AI 正式发布记忆科学开源产品 " 记忆熊 "(Memory Bear)。

这套系统已接入红熊 AI 自研的 Agent 互动服务平台,并在原有客服、营销、教育等多个业务场景中完成了落地。平台数据显示,单日最大 AI 接待量约 35 万次,AI 自助解决率达 98.4%,人工替代率达到 70%。在接入记忆熊后,多轮对话的 token 消耗下降 97%,大模型知识遗忘率被压至 0.1% 以下。与此同时,红熊 AI 的业绩也从最初预期的 3000 万元,上调至 1.9 亿元。

目前,红熊 AI 已将记忆熊的核心框架开源,并上线官网 MemoryBear.AI,希望把 " 记忆 " 做成一项可以被开发者与企业直接调用的基础能力。

" 记忆熊 " 官网 MemoryBear.AI

在国内 Agent 落地还以 " 问答和工具调用 " 为主流路径的当下,红熊 AI 算是较早一批把 " 记忆架构 " 单拎出来做成独立产品、并在真实业务场景里跑通指标的团队之一。

一、AI 的 " 记忆缺失 ",难以支撑企业智能服务

在红熊 AI 接入的多个客服与营销项目中,其团队很快发现一个共性:不补上 " 记忆 " 这一块,再强的大模型也难以在 B 端场景中稳定扛住业务指标。

红熊 AI 发现,最先暴露出来的是单模型层面的知识遗忘。大模型依赖有限的上下文窗口来 " 记住 " 当前对话,早期信息会在长对话中被不断挤出,静态知识库也无法吸收用户在对话中补充的个性化信息。

此外,注意力机制天然存在 " 近因效应 ",越靠后的信息越容易被模型抓住,越往前的细节越容易被忽略,这就造成了典型的 " 答完就忘 "。同一个用户重复强调过几次的偏好和限制条件,只要跨过一定轮次,很容易在后续回答中消失。

亚马逊云科技在今年的 Agent 记忆实践文章里也做了类似总结:LLM 本质是无状态的,每次调用都是一次新的推理,长上下文不仅不能彻底解决记忆问题,反而会带来性能下降和 Token 成本攀升,这一点和红熊在项目中的经验总结是高度一致。

其次是多 Agent 之间的记忆断层,咨询、售后、推荐等 Agent 都会各自维护独立记忆,切换时状态将无法完整继承,容易引发决策冲突。

第三类问题来自语义层面的歧义与行业术语。企业服务里的表达往往是口语化、多语言混用且高度依赖上下文的,具体指向什么,必须结合历史对话才能解释清楚。如果模型只能在当前轮次里做模式匹配,很容易给出模棱两可甚至错误的回复。

正是在这种背景下,红熊 AI 意识到," 记忆 " 需要被单独抽象为一套可设计、可治理的系统能力。

与 AWS 在 Agent 框架中加入专门记忆模块的思路类似,红熊团队选择从 " 重构记忆系统 " 入手,把 " 记性好不好 " 这件事交给一块独立的基础设施来负责。在模型之外再造一套独立、可控、可审计的记忆系统,这也是记忆熊的起点。

二、从记忆到认知,记忆熊如何把 " 类人记忆 " 做成底层能力

记忆熊没有从堆叠更多参数入手,而是先把 " 人怎么记东西 " 这件事拆开:先搞清楚人类记忆的分类,再去给 AI 搭一套对应的记忆架构。

从记忆科学出发,记忆熊把人类感知记忆、工作记忆、显性记忆、隐性记忆、情绪记忆逐一映射到 AI 的多模态输入缓存、短期任务内存、结构化知识库、行为习惯模块和情感加权记忆等组件。

人类记忆与记忆熊的记忆映射

简单来说,看到什么、当下在处理什么、长期知道些什么、习惯怎么做决策、以及对不同事件 " 在意程度 " 有多高,都会在系统里有各自的位置和处理方式。

在此基础上,记忆熊把 " 人是如何记东西 " 的认知科学抽象成一整套可工程化的记忆架构:从多模态采集出发,到结构化图谱,再到分级审核与在线应用。

Memory Bear . AI 记忆熊在线应用

企业可以像接入数据库一样,为自身的 AI 系统接入一块可控、可演进的 " 记忆大脑 "。

三、从客服到教育,记忆让 AI 大幅度提高在业务中的价值

从红熊 AI 披露的项目数据看,它已经实打实顶住了企业每天几十万次交互的业务现场。

其 Agent 互动服务平台在激烈竞争压力下,保持了较高的稳定性和服务质量:单日最大 AI 接待量达到 35 万次,AI 自助解决率达 98.4%,人工替代率达 70%,复杂问题自动路由率达 91.7%,模型幻觉率低于 0.2%,业务回答准确率稳定在 99% 左右。

红熊 AI Agent 互动服务平台实践效果

这些核心指标也反映出 " 记忆 " 在提升服务连续性与一致性方面已发挥出一定的作用。

在技术评估上,记忆熊同样展现出明显优势。根据 LOCOMO 数据集测试结果,记忆熊在单跳、多跳、开放域以及时序类任务中的 F1、BLEU 与 Judge 分数均优于 Mem0、Zep、LangMem 等主流记忆方案,整体性能处于领先。

在具体行业场景中,红熊 AI 的能力也通过多个典型应用得到验证。从智能客服、营销自动化到教育辅导、企业内部知识管理等场景中,记忆熊通过跨会话、跨角色、跨渠道的统一记忆体系,让 Agent 始终保持连贯理解与稳定决策。

在生态层面,记忆熊已将核心框架开源至 Github,并上线官网 MemoryBear.AI,希望与开发者共同完善记忆科学技术体系。

随着 Agent 化应用越来越多、企业对 " 可控记忆 " 和 " 组织记忆中枢 " 的需求增强,像记忆熊这样的记忆平台有机会成为 AI 基础设施的一环。

结语:记忆,能让 AI 变得更 " 有用 "

红熊 AI 在记忆科学上的进展,把长期被忽视的 " 记忆 " 能力打造为可直接依赖的基础设施:一端承接多模态大模型和 Agent 的推理与生成能力,一端对接企业真实的业务流程与长期信息,使模型不再在每次交互中从零开始。

对行业而言,补上 " 记忆 " 这一块,大模型的表现将不再单一受限于上下文长度,而是由一套可持续积累、可持续调用的结构化记忆体系来支撑,使其在复杂的任务中保持更稳定的有效性。

随着多模态大模型、Agent 框架与记忆科学不断融合," 记忆 " 这条技术主线会向更高层次的能力延展,让 AI 从短暂回应的工具,逐步演化为能理解、能延续,也能长时间工作的系统。

AI 从 " 能回答 " 迈向 " 长期记忆、持续反馈 " 的那一步,很可能就建立在这块看不见却持续发挥作用的记忆基座之上。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

ai 亚马逊 基础设施 智能客服 开源
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论