Alter聊科技 21小时前
从“会聊天”到“干实事”,亚马逊云科技让Agent“长出了手脚”
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

2023 年是生成式 AI 元年,2024 年是 Agent 试验期,2025 年正式宣告 AI Agent 进入企业级生产阶段的时代,已经到来。

撰文张贺飞

编辑沈菲菲

美国西部时间 12 月 2 日的 2025 亚马逊云科技 re:Invent 上,亚马逊云科技首席执行官 Matt Garman 在开场演讲中抛出了一个观点:AI Agent 时代已来,未来将出现数十亿 AI Agent,为企业提效 10 倍以上!

现场兴奋和焦灼情绪交织,数万名开发者和企业高管都在等一个答案。

因为在很多人的印象里,AI Agent 的现实体感并不乐观:开发门槛高、编排逻辑复杂、安全治理缺位、上下文记忆像金鱼……导致了一个尴尬的行业现状—— 90% 的 Agent 项目停留在概念验证阶段。

想要从概念验证走向生产可用,中间隔着的不仅仅是代码行数,而是一道道深不见底的 " 工程鸿沟 "。

悬念并未持续太久。

亚马逊云科技 Agentic AI 副总裁 Swami Sivasubramanian,在 12 月 3 日的主论坛上,用严谨且务实的演讲给出了答案——怎么把 AI Agent 从概念验证推向生产环境。

-  01  -

对症下药,解决 POC 到生产环境的五大顽疾

为什么不少企业的 Agent" 看起来很美,用起来很废 "?

剥开光鲜的 Demo 外衣,在生产环境中面临着五个棘手的痛点:

1、部署难、扩展难,一上生产就不稳定;

2、记忆缺失,Agent 无法跨任务学习,无法持续执行大型流程;

3、身份、权限、凭证管理太难,易出安全事故;

4、工具、数据、系统碎片化,集成成本极高;

5、无法观测、无法调试,Agent 成为黑箱。

Swami 在演讲中一针见血地指出:" 大多数实验和 PoC 并未按生产就绪的标准来设计。我们需要弥合这一差距,打破 PoC 的桎梏。" 相对应的,亚马逊云科技对 Agent 在生产环境中遇到的顽疾,通过 Amazon Bedrock AgentCore 进行了对症下药。

AgentCore Runtime 提供了一个无服务器、强隔离、长时运行的环境,彻底让开发者告别用拼凑的 Lambda 函数和脚本手搓的运行环境,实现了 Serverless 托管执行、强会话隔离、长时会话等能力,解决了 " 状态管理 " 的老大难问题,让 Agent 能够像人类员工一样长期在线,随时待命。

AgentCore Memory 构建了短期 + 长期 + 情景记忆的三层体系,让 Agent 具备了 " 记住→学习→改进→再执行 " 的闭环能力。特别是 " 情景记忆 ",可以让 Agent 记住 " 发生过什么事 " 以及 " 为什么那次流程很混乱 ",并自动学习策略、优化下一次行动路径,实现企业 Agent 所需的 " 连续性 " 与 " 可学习性 "。

AgentCore Identity 赋予了 Agent" 可控、可审计、可授权 " 的企业级身份体系,实现从 " 人类身份体系 " 向 "Agent 身份体系 " 的扩展。毕竟在真实的生产环境中,最可怕的不是 Agent 不工作,而是拿着 CEO 的权限去读 HR 的数据库,需要精准控制 Agent 的权限,把潜在的安全隐患锁死在笼子里。

AgentCore Gateway 扮演了 " 协调枢纽 " 的角色,自动扫描分散在数据库、SaaS 应用、旧系统里的数据,自动生成 Agent 的 " 工具地图 ",让 Agent 能安全、智能、自动地 " 发现→连接→使用 " 所有工具与数据。

AgentCore Observability 解决的是 " 黑盒 " 问题,让企业能实时看到 Agent 的推理、工具调用、状态流、错误、上下文与决策路径等工作流程,提前验证 Agent 会不会搞砸,避免出了问题却找不到原因。

亚马逊云科技开出的 " 药方 " 是否奏效呢?

可以佐证的是汽车服务与技术提供商 Cox Automotive 的例子,使用 AgentCore 搭建了一个名为 Fleet Mate 的 Agent,原本需要 2 天时间的车辆评估被压缩到了 30 分钟。

-  02  -

瞄准靶心,让模型定制成为产品化工程

解决 Agent 的工程落地只是第一步,大模型同样是制约生产力的瓶颈,很多企业面临的障碍不亚于生产环境。

譬如通用大模型不懂企业业务,而且模型参数规模大、推理成本高、延迟难以满足业务要求;业务规则经常变、新场景不断出现,导致模型上线后效果会衰退;模型定制需要 MLOps、SRE、算法、数据团队协作,需要专业的团队才能做……能力强、速度快、成本低几乎成了不可能三角。

监督微调、模型蒸馏、强化学习是业内公认的 " 三大法宝 ",亚马逊云科技的解题思路也不例外。

不同的是,亚马逊云科技打出了一套组合拳,从 " 微调 " 到 " 预训练 ",把模型定制从玄学变成了工程学。

一是 Amazon   Bedrock 强化微调。

传统的微调(SFT)只是教模型 " 怎么说话 ",而强化学习(RL)是教模型 " 怎么做对 "。但强化学习需要构建复杂的奖励模型,难度太大了。

亚马逊云科技的强化微调(RFT)功能,直接把强化学习的门槛踏平了,只需要提供数据,就能自动处理奖励建模和策略优化,能够将模型的准确性提升 66%,让一个小模型通过针对性的强化训练,在特定任务上吊打通用大模型。

二是 Amazon   SageMaker AI 无服务器定制。

以前训练一个模型,需要配环境、调参、洗数据,准备工作就需要几个月,Amazon SageMaker AI 提出了新的思路——用 AI 来制造 AI。

企业用自然语言描述需求,SageMaker 内置的 Agent 会自动分析场景、推荐微调技术、甚至直接帮企业生成合成数据,然后自动跑完训练流程。把 " 需要大团队、长周期、重投入 " 的模型定制,变成了 " 几天完成的自动化任务 "。

三是 Amazon Nova Forge。

像医药、金融等行业,不仅需要微调大模型,还要模型在底层就理解行业逻辑,但在传统的流程里,企业数据无法进入预训练阶段。

Amazon Nova Forge 全球首创了 " 开放训练模型 " 体系,允许企业在模型的 " 中途训练阶段 " 介入,注入自己的专有数据,不再是打补丁式的微调,而是让企业以极低的成本,拥有了一个 " 流淌着自己血液 " 的预训练模型。

四是 Amazon SageMaker HyperPod 无检查点训练。

在大模型训练的过程中,断点续训一直是噩梦,一次 GPU 故障可能导致数小时的进度回滚,造成真金白银的损失。

Swami 在演讲中提到了 HyperPod 无检查点训练的 " 黑科技 ",通过实时保存模型状态,在硬件故障时,能在几分钟内自动恢复,不需要回滚到几个小时前的 Checkpoints,大大降低了大规模训练的沉没成本。

做一个总结的话,亚马逊云科技开启了一场从 " 把模型训练好 ",到 " 把模型训练得起、用得好 " 的全链路效率革命,让模型定制从技能工程,进化为可复制的产品化工程。

-  03  -

落地为王,打通可信、可靠、可协作闭环

企业把 Agent 推向生产环境后,CEO 们最担心的问题,可能不是 " 它能不能做 ",而是 " 我敢不敢让它做 "。

摆在案头的是更深层次的挑战:Agent 是否可信,在和客户沟通时会不会乱讲?Agent 是否可靠,业务成功率能否达到企业要求?Agent 能否与人类协同,融入已有客服 / 运营 / 业务流程?

喊出 " 为企业提效 10 倍以上 " 的亚马逊云科技,不只要帮企业打造生产环境、训练更聪明的大脑,还要打消 " 敢不敢用 " 的疑虑。亚马逊云科技没有回避,在主题演讲中留出了相当长的篇幅。

首先是可信。

亚马逊云科技杰出科学家 Byron Cook 讲了一个深刻的逻辑:大模型是基于统计学的,是概率性的,天生存在幻觉;而企业的规则(尤其是 GDPR 等合规要求的出海企业)是逻辑性的、是确定的。

怎么解决这个矛盾呢?答案是神经符号 AI。

简单来说就是把 " 左脑的逻辑 " 和 " 右脑的直觉 " 结合起来。亚马逊云科技引入了 " 自动推理 " 技术,带来了三大能力:

验证输出:自动推理工具验证 LLM 的答案是否满足逻辑和规则。

训练结合:使用定理证明器训练,使模型天然具备逻辑正确性。

约束解码:推理层嵌入验证器,使模型不能越界生成内容。

目前神经符号 AI 已经应用到 Amazon Kiro、AgentCore Policy 等产品中,让 Agent 既聪明又听话。

然后是可靠。

Agent 落地的最大障碍之一在于," 大脑 " 和 " 手脚 " 是分离训练的,导致模型懂流程,但操作起来 " 笨手笨脚 "。

亚马逊云科技正式发布了 Amazon Nova Act,一个专门为 " 行动 " 而生的模型,在训练中进行了数百个环境 + 数千工作流程 + 数十万交互的强化学习,进行了成千上万次的试错。结果超出了不少人的预期:在企业自动化工作流中,Amazon Nova Act 实现了 90% 的成功率。

也就是说,企业可以放心地把点按钮、填表单、跑流程这些活儿交给 Agent,不必担心它卡在某个弹窗时不知所措。

最终是可协作。

Agent 的终局是什么?是替代人类吗?亚马逊云科技的回答是 "Teammate"(队友)。

折射到技术层面上,Amazon Connect 新增了 8 项 AI 能力,包括让 AI 像真人一样说话的神经声音集成 ( Sonic ) 、基于对话自动建议下一步的实时推荐 Agent、结合点击流数据个性化建议的 AI 驱动预测洞察等。

正如 2025 亚马逊云科技 re:Invent 上所演示的:在一个信用卡盗刷的场景中,Agent 不仅自动验证了身份,还通过分析地理位置和交易模式,预判了欺诈风险,并在后台默默地为人类客服准备好了所有资料。人类客服接起电话的那一刻,问题已经解决了一半。

Agent 不再只是工具,而是和人类一起协作的队友。

-  04  -

写在最后

2025 年的亚马逊云科技 re:Invent,更像是一个时代的分水岭。

过去两年里,行业对 Agent 的热情大多停在愿景层;现在,亚马逊云科技给出了一套从基础设施到模型、从安全到协作、从执行到治理的落地体系。

第一层:AgentCore(让 Agent 能跑起来),解决了部署、管理、记忆、安全、工具接入、可观测性等基础工程问题。

第二层:模型定制(让 Agent 跑得好),通过 RFT、无服务器定制、HyperPod 等把模型从 " 通用 " 变成 " 企业专属 "。

第三层:可信 + 可靠 + 协作(让企业敢用),让 Agent 变得可控、可靠、可协作,成为一个可托付的数字员工。

如果说 2023 年是生成式 AI 的元年,2024 年是 Agent 的试验期,2025 年则正式宣告:AI Agent 进入企业级生产阶段的时代,已经到来。

推荐阅读

 《openEuler 重构数智基础设施》

 《" 先导杯 " 上的三张面孔》

 《读懂 5G 新通话》

 《解构 AI 时代的 " 深圳答案 "》

点 "推荐 ",变好看哦。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

亚马逊云 ai 首席执行官
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论