亚马逊云科技，如何拒绝让Agent沦为玩具？

"Why not？"

在号称 " 云计算 " 春晚的 2025 年亚马逊云科技 re:Invent 大会上，亚马逊云科技 CEO Matt Garman 演讲中就抛出一连串问题：" 为什么开发者不能专注于构建而非基础设施？为什么实验时间与成本不能趋近于零？为什么不能让每一个想法都成为可能？"

事实上，Matt Garman 以上提问，都直指近年 AI Agent 火热浪潮中，一直困扰企业群体如何真正释放生产力的核心命题。历年来，全球企业核心诉求需求没有根本改变，本质仍在于提高效率（SaveTime）。这也是多年来，亚马逊云科技这家业务规模已达 1320 亿美元的全球云巨头一直聚焦的工作。

Agentic AI 时代，AI Agent 不是手段也不是目的，而成为生产力本身，不过前提还在于，需要让 Agent 安全合理地落地并实现高效运转。亚马逊云科技 CEO Matt Garman 在 Keynote 上就谈到："Put Agent into Work。"

事实上，过去数年 AI 正在从 Copilot 向 Autopilot 加速转化过程中，不少企业已经为 " 聊天机器人 " 支付了昂贵的学费，然而实际操作下来，却发现辅助式、被动化的问答模式，很难真正让公司实现业绩实质性增长。因此，Matt Garman 强调的 "Put Agent into Work"，或许也指向了 AI 核心定位的变化，即从一种 " 咨询顾问 " 转变为 " 数字工人 "，需要以一种工作更加主动、细节更加精准、安全更加可控的行为模式，为企业切实创造价值。

如果细看 2025 年 re:Invent 大会上关键人物的发言倾向，不难发现，从亚马逊云科技首席执行官 Matt Garman 到亚马逊云科技 Agentic AI 副总裁 Swami Sivasubramanian，再到亚马逊云科技高级副总裁 Peter DeSantis，均用了大量篇幅讲述 AI Agent 究竟如何有序、有效、有用地落地。

" 未来数十亿 Agent 将渗透各行各业，助力企业实现 10 倍效率跃迁。"Matt Garman 在开篇演讲中激昂谈到。

值得注意的是，近二十年来亚马逊云科技一直通过推动云计算和生成式 AI 普及在各行各业 " 搭台唱戏 "，成为全球企业群中效能放大器的典范，" 利他战略 " 也让企业实现了二次成长，仅仅在过去一年，亚马逊云科技新增营收就达 220 亿美元。

一、利他思维如何更好地 " 搭台唱戏 "

没有一个真正的战略家是对战术细节不熟悉的，一个真正的战略家也不会将战略眼界聚焦短期胜败上。

亚马逊科技 2025 年 re:Invent 大会首日，公司 CEO Matt Garman 两个多小时主题演讲聚焦与发散并进，实际上也是以上定论的集中反映。

一方面，Matt Garman 全场两个多小时的 Keynote 就发布新品接近 40 个，集中展现了亚马逊云全新一代自研芯片、前沿基础模型及企业级模型定制框架等一系列重磅产品，在算力层、模型层和应用层持续突破，令人有一种应接不暇的感觉。

另一方面，Matt Garman 的绝大多数时间，实际聚焦在了 AI 基础设施和全新 Agent 产品的讲解上。对此，Matt Garman 直截了当地指出："AI Agent 正在把我们带到 AI 发展的关键拐点。未来每家公司，每一个可以想象的领域中都会运行数十亿个 Agent！"

什么让亚马逊云科技有了这样的判断？这与近些行业在 AI 浪潮中所处的一个尴尬境遇密不可分：仅从目前来看，AI 浪潮助力下的企业仍无法实现投入产出比的均衡，巨额投入什么时候才能转化为企业实实在在的业绩反映，也成为困扰众多企业 CEO 的难题。

为了破局，为了让 AI 从 Assistant 加速质变成能主动干活、充分释放生产力的 Agent，并且让 Agent 更可信、更好用、更可控、成本更低，亚马逊云开出了自己完整的解决方案，即算力基础设施、推理平台、数据、还有实现 Agent 的一系列工具链。

贯穿亚马逊云科技以上解决方案的核心思路则在于，向下自研芯片，以性价比夯实算力底座，中间扩充模型，提供给客户更多、更厚的选择，向上则树立规则，严格把控 Agent 实际操作风险，从而真正达成一整套可用、可信、可控的技术闭环。

比如说，当下 Agent 对 Token 消耗量，已经达到了较为简单 AI 对话的十倍以上。为此，如何更直接地降低 Token 成本，为企业提供性价比算力基础设施配套，就成为亚马逊云科技的一大发力点。

在备受期待的算力基础设施构建上，亚马逊云科技一方面作为运行 NVIDIA GPU 的核心场所之一，积累了大规模的 GPU 运行经验，由此，本次大会公司例举 P6e GB200 超级服务器就相比上一代 P5e，计算性能提升超过 20 倍。

此外，亚马逊云科技始终没有减缓自身底层芯片布局。本次大会上，Matt Garman 宣布正式推出了最新 Trainium3，并且发布 Amazon Trainium3 UltraServers，这也成为亚马逊云科技首款搭载 3 纳米工艺 AI 芯片的服务器。

相较 Amazon Trainium2，不仅计算能力提升 4.4 倍、内存带宽提升 3.9 倍，每兆瓦算力可处理的 AI token 数量达成了 5 倍增长，为大规模 AI 训练与推理带来显著的效率与能效优势。并且，新一代服务器在运行 OpenAI 的 GPT-OSS-120B 模型时，每兆瓦输出 token 数是 Amazon Trainium2 的 5 倍以上，可实现更极致的能耗比。

大会上，Matt Garman 还首次披露了 Amazon Trainium4 芯片，承诺将实现较 Amazon Trainium3 UltraServers 六倍的 FP4 计算性能、四倍内存带宽和两倍高内存容量，继续坚守亚马逊云科技在 AI 芯片领域的长期投入的战略定力。

值得注意的是，基础算力的底座夯实上亚马逊云科技常年持续投入，如今已完成超 100 万个 Amazon Trainium2 芯片规模化部署，为 Amazon Bedrock 中大部分推理工作提供了稳定可靠的算力支持，并且已为公司带来了几十亿美元可观收入。

某种程度上说，也正式由于亚马逊云科技对自研芯片持续的投入，也让公司在当下越发复杂的竞争环境中拥有了更多主动权。尤其是在算力即权力的当下，一旦企业的核心利润被上游硬件厂商大幅拿走，那么云厂商在博弈中占据主动。

从这点上说，亚马逊云科技自研芯片构建发力点不仅仅是技术壁垒，更是一种构建自身 UE 的必然：尤其是当 Agent 时代来临，Token 消耗量呈现出指数级增长时，要想实现商业更长久健康的盈利，基础算力上的 " 自研 " 与 " 降本 " 必不可少。

除了算力，第三方模型引用上 Amazon Bedrock 也持续丰富着客户模型选择权，在 " 利他战略 " 下持续开源、继续 " 搭台唱戏 "。大会现场，亚马逊云科技展现出一种更为开放姿态，Matt Garman 则向世人宣布，公司收录了更多开源、通用、专用等多种类型的模型。其中，Amazon Bedrock 就收录了包括谷歌的 Gemma、NVIDIA 的 Nemotron，Kimi 和 Minimax 厂商的最新模型，真正为亚马逊云科技的客户提供了模型运用上更广阔的空间。

与此同时，亚马逊云科技也在让自身大模型继续进化，大会现场同步了 Amazon Nova 迭代到了 Amazon Nova 2 的最新进展。该大模型包含 Amazon Nova 2 Lite、Amazon Nova 2 Pro、Amazon Nova 2 Sonic、Amazon 2 Omni 四个版本可供客户在不同场景中调用，延续了强大智能能力同时，也持续将成本效率与低延迟表现大幅提升。

并且，Amazon Nova 2 实际测试中各个版本性能表现也都可圈可点。例如，Amazon Nova 2 Lite 性能就可比肩 GPT-5 Mini、Claude Haiku 4.5 等业界先锋模型。此外，Amazon Nova 2 Pro 在指令遵循、Agentic 工具使用等基准上超越 GPT-5.1、Gemini 3 Pro Preview 以及 Claude Sonnet 4.5，进步显著。

而在数据层面， Amazon AI Factories 的推出，则更能反映公司的 " 利他战略 "：对于某些特殊客户来说，数据处境与安全始终摆在第一性，为此，Amazon AI Factories 一经推出，就可将全套的 AI 算力集群、网络架构、存储设施，直接打包运到客户的本地数据中心里，实现了安全与算力的平衡统一。

事实上，Amazon AI Factories 的推出，也在某种程度上揭示了一种云计算叙事逻辑的改变：过去多年，企业大趋势是 " 上云 "，可到 AI 时代后，由于数据主权、隐私和安全问题左右，如何让 " 云下来 "，则成为一种维护数据资产的必然选择。

二、怎么让 Agent 可信、可靠、可用？

除了基础算力与模型扩展，亚马逊云科技 2025 re:Invent 大会上，还创造性提出了如何帮助客户 " 调教 " 出一个可控、可用、可信的 Agent。某种程度上说，以上技术路线上展现的切实性，也是亚马逊云科技核心竞争力的一种外化。

例如，当大多数平台还在比拼 Agent 框架灵活性、推理速度时，亚马逊云科技则更为敏锐又贴切地意识到，或许企业需要的不是一个能聊天的机器人，而是一个能干活的员工。

为此，亚马逊云科技围绕如何让 Agent 安全合理地高效落地，去解决企业种种核心痛点，大会上就推出了 Agentic AI 平台 Amazon Bedrock AgentCore。在该平台 " 约束 " 下，Agent 的日常使用、行为秩序得到了更好的秩序，由此公司则可大规模地安全构建、部署和运行高性能的 Agent。

为了确保 Agent 运行过程中的安全性与合规性，亚马逊云科技则开放了 AgentCore Policy、AgentCore Evaluations 功能。此举的启迪意义，或许不止于帮助客户规避失序风险，更在于亚马逊云科技尝试着定义出 Agent 时代下一种全新的治理范式。

这已经不是一种简单的程序约束，而是给 Agent 制定出了一套行事准则，甚至说 " 法律法规 "。由此一来，用户在 Agent 运行过程中，就可以从人类行事的逻辑去规劝、约束 AI，只有这样，企业的更多核心业务或许才会让 Agent 落地产生可能。

这也触及到了 Agent 大规模落地的真正痛点。某种程度上说，大模型有一定概率性，可回到企业业务流程中，尤其涉及到财务层面，需要的必须是 100% 的确定性。事实上，企业群体头疼的往往不是 AI 不够聪明，而是 AI" 一本正经地胡说八道 " 或 " 违规 " 越权操作。从这点上说，Amazon Bedrock AgentCore 的核心价值或许就在于，给相对不可控的 Agent 加上确定性 " 枷锁 " 后，很多风险将会被隔绝。

事实上，Agent 兴起的潮流下，围绕 " 风险 " 衍生出大量核心的讨论：比如在企业核心业务的使用场景下，一个不可控的 Agent 会展现出如何巨大的破坏力？这样的猜想在不少科幻电影中已经出现了大量发人深省的故事。

正因如此，除了 Amazon Bedrock AgentCore，如何更快、更安全地将 Agent 加入到日常工作中来，亚马逊云科技也提出自己一系列方案。比如，Amazon Quick 作为一款面向企业的智能 Agent 应用，不仅能够帮助用户进行深度分析、数据可视化和工作流自动化，还可以通过企业级的安全与隐私标准确保信息的可靠性与合规性。

除此之外，在备受关注的 AI 编程领域，亚马逊云科技在大会现场，也提出了三大 Agent ——比如，Kiro autonomous agent，可以作为虚拟开发者，持续分担人类工作，并且能够独立完成各项任务，并在工作中持续学习拓展能力边界。再比如，Amazon Security Agent 则可以承担虚拟安全工程师的角色，在应用设计、代码审查与渗透测试等环节充当起企业的安全顾问，极大降低安全风险。还有可以帮助开发者，尤其是负责值班的工程师，主动发现系统故障或潜在缺陷的 Amazon DevOps Agent。

从这点上说，鉴于亚马逊云科技在服务行业二十年来积累的大量经验，无疑不在证明，各行各业、不同规模的组织面临的需求痛点，都让这家企业能在第一时间准确捕捉，由此根据企业现实存在的痛点。

并且，此次大会基于底层算力、推理平台、数据再到 Agent 产品链路，亚马逊云科技在今年 re:Invent 上展现出的，或许是自身一步步地把早期具有 " 玩乐 " 属性、技术噱头的 Agent ，由此正式推向商业实战中。

三、在 Agent 时代，找回丢失的创造力

过去两年，我们无不见证了大模型带来的颠覆，同时也看到了其呈现的局限性。

比如，大模型或许能写诗作画，却很难替用户解决更多实际问题，比如买一张机票：从这点上说，Agent 与传统大模型助手的核心区隔，或许就在于分自主行动力。

在这一视角下，Agent 需要担负起的责任，则更加精细化，是一个能够主动执行任务、在复杂环境中实现动态推理、并让工作流程自动化的 " 数字员工 "，也是一种未来生产力的集中释放。

亚马逊云科技 2025 re:Invent 大会上，亚马逊云科技 Agentic AI 高级副总裁 Swami Sivasubramanian 的 Keynote 上，就围绕 Agent 如何重塑商业世界的可能展开了核心推论。

比如，AI Agent 如何才能实现真正的大规模生产落地，从而将概念性变为真切的生产力提升？

Swami Sivasubramanian 的 Keynote 上提到了一个生动案例：当我们最早写下第一行代码时是怎样的感觉？这样一种类似造物者、仿佛能做到任何事的创作自由，在 Agent 时代又该如何找回？

事实上，以往用户无拘无束、无所不能的创作欲表现，到了现在，却随着 AI 系统的日益复杂，变得更加难以实现：尤其是那些概念验证阶段看似表现良好的 AI，一旦进入大规模应用，却往往因为逻辑脆弱、缺乏模块化，从而对用户想象力、生产力的激发产生了一种反作用。

为了解决以上痛点，亚马逊云科技则将发力点聚焦到了 " 简洁性 " 上。比如，一个 Agent 往往由基础模型、代码和工具三大组件构成，协同编排这些组件往往比较繁琐，为此，亚马逊云科技则发布并开源了 Amazon Strands Agents SDK。

这一框架也被引入了 TypeScript 平台，今后，开发者则能够利用熟悉的工具栈构建完整出 Agent 堆栈。更关键的是，Strands 还新增了对边缘设备的支持。这意味着，未来 Agent 将不再局限于云端服务器，而是可以运行在汽车、游戏机甚至机器人终端上。值得注意的是，短短数月，该 SDK 下载量突破 500 万次，再次证明了开发者对 " 简洁性 " 的青睐。

另一个制约生产力解放的直接命题，也被 Swami 关注到了。比如，为了解决当下 AI 普遍存在的 " 健忘症 "、即无法在长期交互中沉淀经验，Amazon Bedrock AgentCore Memory 推出后，则接入了全新的情景式记忆功能，能够让 Agent 从过往的上下文、推理过程、操作结果中持续学习，并将这些信息应用于后续交互。

在帮助 Agent 解决了 " 聪明 " 的能力后，亚马逊云科技也对其效率提升，集中下手。Swami 更是直言：" 效率关乎成本、规模与敏捷性。"

事实上，尽管通用的基础模型虽然 " 智商高 "，但在处理特定任务时，往往伴随着高昂的成本和延迟。由此，企业特定使用场景中，" 小而美 " 的高质量定制模型已渐成主流。

这也是 AI 开发模式一种必然的 " 祛魅 " 过程。以往，行业迷信 " 参数至上 "，不过，Swami 的观点则强调专用性一定程度、一定场景下，无疑将会优于通用性。类似一家企业不需要一个样样稀松的通才，相反，去打造成百上千个精通业务细节的专才，或许才能真正释放生产力。

基于此，亚马逊云科技也打出了一套组合拳。比如，RFT 可让定制模型的准确率相比基础模型提升 66%。再加上 Amazon Nova Forge 开创了 " 开放式训练 " 的先河，允许企业在训练各阶段注入专有数据，让模型不仅懂通用知识，更懂企业的 " 行话 "。

以上这一切，也让定制化实现效率大幅提升成为一种未来的趋势。并且，在让 Agent 变得更聪明、更具效率的同时，如何确保成百上千个 Agent 被部署在生产链条的风险把控，也成为了一大重点。

对此，Swami 则进一步将失序把控的解决方案细化给出。除了先前介绍的 Amazon Bedrock AgentCore，为了进一步提升可靠性，亚马逊云科技还推出 Amazon Nova Act。这是一套用于构建可靠 UI 工作流程的全新服务，由定制版的 Amazon Nova 2 Lite 模型驱动。它结合了自动推理（Automated Reasoning）的数学逻辑验证，在早期测试中实现了高达 90% 的可靠性。

甚至，在现场演示的 " 反电诈 " 场景中，Agent 不仅能检查信用卡交易、合理提出怀疑，甚至能收集证据并协助报警。这种基于逻辑验证的严谨性，让 " 人机信任 " 不再是一句空话。

四、一条实实在在的道路

大会最后一天，亚马逊云科技发布了自身迄今为止性能最强、能效最高的 Amazon Graviton5 处理器。与上一代相比，基于 Graviton5 的全新 EC2 M9g 实例性能提升高达 25%，实现了单封装 192 核心的突破，并将 L3 缓存提升了 5 倍。一个直观的使用案例是，Apple 在迁移核心服务后，实现了成本降低 30%、性能提升 40% 的不错效益。

值得注意的是，目前亚马逊云科技新增 CPU 容量中连续第三年有超半数由 Graviton 驱动，EC2 头部 1000 家客户中已有 98% 受益于其显著的性价比优势，包括 Adobe、Airbnb、Atlassian、Epic Games、Formula 1 等。

不仅如此，在亚马逊云科技 re:Invent 2025 最终日，公司从 Amazon Graviton5 和 Amazon Trainium3 UltraServers 的极致能效展示，到 Amazon S3 Vectors 和 Amazon Lambda Managed Instances 重新定义了数据和无服务器的边界，并最终通过 Project Mantle 的系统级创新，再次完整地收束了过去数天公司想要强调的 AI 时代核心理念。

事实上，亚马逊云科技 2025 re:Invent 大会临近尾声时，公司则用大量基础设施产品的密集发布，重申了一个公司发展的核心命题：即 AI 不会颠覆基础设施，反而会让基础设施的安全性、成本和敏捷性等变得更加显著。

从这点上说，再次回顾亚马逊云科技 2025 年 re:Invent 大会，真正留下的或许不是一串令人眼花缭乱的产品清单，而是一张清晰、实用、贴切的企业发展蓝图。

从 Nitro 到 Graviton 再到 Trainium 的完整自研芯片堆栈，以及 Apple、Anthropic 等重量级客户背书，亚马逊云科技的企业竞争力壁垒中，一直有特殊且务实的底座：即当其他云厂商仍在试图证明自身 " 能做 AI" 时，亚马逊云科技则已经将视野聚焦到了用 " 安全性、可用性、成本可控 " 等，能直达商业核心的解决办法，再次证明了自己在 AI 规模化、可持续发展、盈利实现等方面，于行业内扮演了一个重要且不可或缺的角色。

值得注意的是，大会最后一天，亚马逊 CTO Dr. Werner Vogels 也完成了他在 re:Invent 的最后一场主题演讲，并谈到：AI 不会取代开发者，但停止进化的开发者则会被时代淘汰。

从这点上说，亚马逊云科技在 AI 的聚光灯下，或许选择了一条最不性感、最不显眼的道路。从过去到未来，亚马逊云科技始终在做的事情，核心仍在于为 AI 时代去 " 修筑铁路、铺设电网 "，这样看似 " 重资产、硬科技 " 的路径，表面显得笨重，内在则是在规模效应作用上去打造自身难以撼动的竞争壁垒。

2025 亚马逊云科技 re:Invent 中国行即将启幕：12 月 18 日开始，北京、上海、深圳、成都四城线下巡演及线上专场将同步开启，无论你是云计算新手还是技术老兵，都将从高阶演讲、实战内容、技术分享和专家互动中受益。点击【阅读原文】立即注册，抢占席位，把握 Agentic AI 时代的新机遇！

--THE END--

宙世代

一起剪

相关标签