
"Why not?"
在号称 " 云计算 " 春晚的 2025 年亚马逊云科技 re:Invent 大会上,亚马逊云科技 CEO Matt Garman 演讲中就抛出一连串问题:" 为什么开发者不能专注于构建而非基础设施?为什么实验时间与成本不能趋近于零?为什么不能让每一个想法都成为可能?"
事实上,Matt Garman 以上提问,都直指近年 AI Agent 火热浪潮中,一直困扰企业群体如何真正释放生产力的核心命题。历年来,全球企业核心诉求需求没有根本改变,本质仍在于提高效率(SaveTime)。这也是多年来,亚马逊云科技这家业务规模已达 1320 亿美元的全球云巨头一直聚焦的工作。
Agentic AI 时代,AI Agent 不是手段也不是目的,而成为生产力本身,不过前提还在于,需要让 Agent 安全合理地落地并实现高效运转。亚马逊云科技 CEO Matt Garman 在 Keynote 上就谈到:"Put Agent into Work。"
事实上,过去数年 AI 正在从 Copilot 向 Autopilot 加速转化过程中,不少企业已经为 " 聊天机器人 " 支付了昂贵的学费,然而实际操作下来,却发现辅助式、被动化的问答模式,很难真正让公司实现业绩实质性增长。因此,Matt Garman 强调的 "Put Agent into Work",或许也指向了 AI 核心定位的变化,即从一种 " 咨询顾问 " 转变为 " 数字工人 ",需要以一种工作更加主动、细节更加精准、安全更加可控的行为模式,为企业切实创造价值。
如果细看 2025 年 re:Invent 大会上关键人物的发言倾向,不难发现,从亚马逊云科技首席执行官 Matt Garman 到亚马逊云科技 Agentic AI 副总裁 Swami Sivasubramanian,再到亚马逊云科技高级副总裁 Peter DeSantis,均用了大量篇幅讲述 AI Agent 究竟如何有序、有效、有用地落地。
" 未来数十亿 Agent 将渗透各行各业,助力企业实现 10 倍效率跃迁。"Matt Garman 在开篇演讲中激昂谈到。
值得注意的是,近二十年来亚马逊云科技一直通过推动云计算和生成式 AI 普及在各行各业 " 搭台唱戏 ",成为全球企业群中效能放大器的典范," 利他战略 " 也让企业实现了二次成长,仅仅在过去一年,亚马逊云科技新增营收就达 220 亿美元。
一、利他思维如何更好地 " 搭台唱戏 "
没有一个真正的战略家是对战术细节不熟悉的,一个真正的战略家也不会将战略眼界聚焦短期胜败上。
亚马逊科技 2025 年 re:Invent 大会首日,公司 CEO Matt Garman 两个多小时主题演讲聚焦与发散并进,实际上也是以上定论的集中反映。

一方面,Matt Garman 全场两个多小时的 Keynote 就发布新品接近 40 个,集中展现了亚马逊云全新一代自研芯片、前沿基础模型及企业级模型定制框架等一系列重磅产品,在算力层、模型层和应用层持续突破,令人有一种应接不暇的感觉。
另一方面,Matt Garman 的绝大多数时间,实际聚焦在了 AI 基础设施和全新 Agent 产品的讲解上。对此,Matt Garman 直截了当地指出:"AI Agent 正在把我们带到 AI 发展的关键拐点。未来每家公司,每一个可以想象的领域中都会运行数十亿个 Agent!"
什么让亚马逊云科技有了这样的判断?这与近些行业在 AI 浪潮中所处的一个尴尬境遇密不可分:仅从目前来看,AI 浪潮助力下的企业仍无法实现投入产出比的均衡,巨额投入什么时候才能转化为企业实实在在的业绩反映,也成为困扰众多企业 CEO 的难题。
为了破局,为了让 AI 从 Assistant 加速质变成能主动干活、充分释放生产力的 Agent,并且让 Agent 更可信、更好用、更可控、成本更低,亚马逊云开出了自己完整的解决方案,即算力基础设施、推理平台、数据、还有实现 Agent 的一系列工具链。
贯穿亚马逊云科技以上解决方案的核心思路则在于,向下自研芯片,以性价比夯实算力底座,中间扩充模型,提供给客户更多、更厚的选择,向上则树立规则,严格把控 Agent 实际操作风险,从而真正达成一整套可用、可信、可控的技术闭环。
比如说,当下 Agent 对 Token 消耗量,已经达到了较为简单 AI 对话的十倍以上。为此,如何更直接地降低 Token 成本,为企业提供性价比算力基础设施配套,就成为亚马逊云科技的一大发力点。
在备受期待的算力基础设施构建上,亚马逊云科技一方面作为运行 NVIDIA GPU 的核心场所之一,积累了大规模的 GPU 运行经验,由此,本次大会公司例举 P6e GB200 超级服务器就相比上一代 P5e,计算性能提升超过 20 倍。
此外,亚马逊云科技始终没有减缓自身底层芯片布局。本次大会上,Matt Garman 宣布正式推出了最新 Trainium3,并且发布 Amazon Trainium3 UltraServers,这也成为亚马逊云科技首款搭载 3 纳米工艺 AI 芯片的服务器。
相较 Amazon Trainium2,不仅计算能力提升 4.4 倍、内存带宽提升 3.9 倍,每兆瓦算力可处理的 AI token 数量达成了 5 倍增长,为大规模 AI 训练与推理带来显著的效率与能效优势。并且,新一代服务器在运行 OpenAI 的 GPT-OSS-120B 模型时,每兆瓦输出 token 数是 Amazon Trainium2 的 5 倍以上,可实现更极致的能耗比。
大会上,Matt Garman 还首次披露了 Amazon Trainium4 芯片,承诺将实现较 Amazon Trainium3 UltraServers 六倍的 FP4 计算性能、四倍内存带宽和两倍高内存容量,继续坚守亚马逊云科技在 AI 芯片领域的长期投入的战略定力。

值得注意的是,基础算力的底座夯实上亚马逊云科技常年持续投入,如今已完成超 100 万个 Amazon Trainium2 芯片规模化部署,为 Amazon Bedrock 中大部分推理工作提供了稳定可靠的算力支持,并且已为公司带来了几十亿美元可观收入。
某种程度上说,也正式由于亚马逊云科技对自研芯片持续的投入,也让公司在当下越发复杂的竞争环境中拥有了更多主动权。尤其是在算力即权力的当下,一旦企业的核心利润被上游硬件厂商大幅拿走,那么云厂商在博弈中占据主动。
从这点上说,亚马逊云科技自研芯片构建发力点不仅仅是技术壁垒,更是一种构建自身 UE 的必然:尤其是当 Agent 时代来临,Token 消耗量呈现出指数级增长时,要想实现商业更长久健康的盈利,基础算力上的 " 自研 " 与 " 降本 " 必不可少。
除了算力,第三方模型引用上 Amazon Bedrock 也持续丰富着客户模型选择权,在 " 利他战略 " 下持续开源、继续 " 搭台唱戏 "。大会现场,亚马逊云科技展现出一种更为开放姿态,Matt Garman 则向世人宣布,公司收录了更多开源、通用、专用等多种类型的模型。其中,Amazon Bedrock 就收录了包括谷歌的 Gemma、NVIDIA 的 Nemotron,Kimi 和 Minimax 厂商的最新模型,真正为亚马逊云科技的客户提供了模型运用上更广阔的空间。
与此同时,亚马逊云科技也在让自身大模型继续进化,大会现场同步了 Amazon Nova 迭代到了 Amazon Nova 2 的最新进展。该大模型包含 Amazon Nova 2 Lite、Amazon Nova 2 Pro、Amazon Nova 2 Sonic、Amazon 2 Omni 四个版本可供客户在不同场景中调用,延续了强大智能能力同时,也持续将成本效率与低延迟表现大幅提升。
并且,Amazon Nova 2 实际测试中各个版本性能表现也都可圈可点。例如,Amazon Nova 2 Lite 性能就可比肩 GPT-5 Mini、Claude Haiku 4.5 等业界先锋模型。此外,Amazon Nova 2 Pro 在指令遵循、Agentic 工具使用等基准上超越 GPT-5.1、Gemini 3 Pro Preview 以及 Claude Sonnet 4.5,进步显著。
而在数据层面, Amazon AI Factories 的推出,则更能反映公司的 " 利他战略 ":对于某些特殊客户来说,数据处境与安全始终摆在第一性,为此,Amazon AI Factories 一经推出,就可将全套的 AI 算力集群、网络架构、存储设施,直接打包运到客户的本地数据中心里,实现了安全与算力的平衡统一。
事实上,Amazon AI Factories 的推出,也在某种程度上揭示了一种云计算叙事逻辑的改变:过去多年,企业大趋势是 " 上云 ",可到 AI 时代后,由于数据主权、隐私和安全问题左右,如何让 " 云下来 ",则成为一种维护数据资产的必然选择。
二、怎么让 Agent 可信、可靠、可用?
除了基础算力与模型扩展,亚马逊云科技 2025 re:Invent 大会上,还创造性提出了如何帮助客户 " 调教 " 出一个可控、可用、可信的 Agent。某种程度上说,以上技术路线上展现的切实性,也是亚马逊云科技核心竞争力的一种外化。
例如,当大多数平台还在比拼 Agent 框架灵活性、推理速度时,亚马逊云科技则更为敏锐又贴切地意识到,或许企业需要的不是一个能聊天的机器人,而是一个能干活的员工。

为此,亚马逊云科技围绕如何让 Agent 安全合理地高效落地,去解决企业种种核心痛点,大会上就推出了 Agentic AI 平台 Amazon Bedrock AgentCore。在该平台 " 约束 " 下,Agent 的日常使用、行为秩序得到了更好的秩序,由此公司则可大规模地安全构建、部署和运行高性能的 Agent。
为了确保 Agent 运行过程中的安全性与合规性,亚马逊云科技则开放了 AgentCore Policy、AgentCore Evaluations 功能。此举的启迪意义,或许不止于帮助客户规避失序风险,更在于亚马逊云科技尝试着定义出 Agent 时代下一种全新的治理范式。
这已经不是一种简单的程序约束,而是给 Agent 制定出了一套行事准则,甚至说 " 法律法规 "。由此一来,用户在 Agent 运行过程中,就可以从人类行事的逻辑去规劝、约束 AI,只有这样,企业的更多核心业务或许才会让 Agent 落地产生可能。
这也触及到了 Agent 大规模落地的真正痛点。某种程度上说,大模型有一定概率性,可回到企业业务流程中,尤其涉及到财务层面,需要的必须是 100% 的确定性。事实上,企业群体头疼的往往不是 AI 不够聪明,而是 AI" 一本正经地胡说八道 " 或 " 违规 " 越权操作。从这点上说,Amazon Bedrock AgentCore 的核心价值或许就在于,给相对不可控的 Agent 加上确定性 " 枷锁 " 后,很多风险将会被隔绝。
事实上,Agent 兴起的潮流下,围绕 " 风险 " 衍生出大量核心的讨论:比如在企业核心业务的使用场景下,一个不可控的 Agent 会展现出如何巨大的破坏力?这样的猜想在不少科幻电影中已经出现了大量发人深省的故事。
正因如此,除了 Amazon Bedrock AgentCore,如何更快、更安全地将 Agent 加入到日常工作中来,亚马逊云科技也提出自己一系列方案。比如,Amazon Quick 作为一款面向企业的智能 Agent 应用,不仅能够帮助用户进行深度分析、数据可视化和工作流自动化,还可以通过企业级的安全与隐私标准确保信息的可靠性与合规性。
除此之外,在备受关注的 AI 编程领域,亚马逊云科技在大会现场,也提出了三大 Agent ——比如,Kiro autonomous agent,可以作为虚拟开发者,持续分担人类工作,并且能够独立完成各项任务,并在工作中持续学习拓展能力边界。再比如,Amazon Security Agent 则可以承担虚拟安全工程师的角色,在应用设计、代码审查与渗透测试等环节充当起企业的安全顾问,极大降低安全风险。还有可以帮助开发者,尤其是负责值班的工程师,主动发现系统故障或潜在缺陷的 Amazon DevOps Agent。
从这点上说,鉴于亚马逊云科技在服务行业二十年来积累的大量经验,无疑不在证明,各行各业、不同规模的组织面临的需求痛点,都让这家企业能在第一时间准确捕捉,由此根据企业现实存在的痛点。
并且,此次大会基于底层算力、推理平台、数据再到 Agent 产品链路,亚马逊云科技在今年 re:Invent 上展现出的,或许是自身一步步地把早期具有 " 玩乐 " 属性、技术噱头的 Agent ,由此正式推向商业实战中。
三、在 Agent 时代,找回丢失的创造力
过去两年,我们无不见证了大模型带来的颠覆,同时也看到了其呈现的局限性。
比如,大模型或许能写诗作画,却很难替用户解决更多实际问题,比如买一张机票:从这点上说,Agent 与传统大模型助手的核心区隔,或许就在于分自主行动力。
在这一视角下,Agent 需要担负起的责任,则更加精细化,是一个能够主动执行任务、在复杂环境中实现动态推理、并让工作流程自动化的 " 数字员工 ",也是一种未来生产力的集中释放。
亚马逊云科技 2025 re:Invent 大会上,亚马逊云科技 Agentic AI 高级副总裁 Swami Sivasubramanian 的 Keynote 上,就围绕 Agent 如何重塑商业世界的可能展开了核心推论。

比如,AI Agent 如何才能实现真正的大规模生产落地,从而将概念性变为真切的生产力提升?
Swami Sivasubramanian 的 Keynote 上提到了一个生动案例:当我们最早写下第一行代码时是怎样的感觉?这样一种类似造物者、仿佛能做到任何事的创作自由,在 Agent 时代又该如何找回?
事实上,以往用户无拘无束、无所不能的创作欲表现,到了现在,却随着 AI 系统的日益复杂,变得更加难以实现:尤其是那些概念验证阶段看似表现良好的 AI,一旦进入大规模应用,却往往因为逻辑脆弱、缺乏模块化,从而对用户想象力、生产力的激发产生了一种反作用。
为了解决以上痛点,亚马逊云科技则将发力点聚焦到了 " 简洁性 " 上。比如,一个 Agent 往往由基础模型、代码和工具三大组件构成,协同编排这些组件往往比较繁琐,为此,亚马逊云科技则发布并开源了 Amazon Strands Agents SDK。
这一框架也被引入了 TypeScript 平台,今后,开发者则能够利用熟悉的工具栈构建完整出 Agent 堆栈。更关键的是,Strands 还新增了对边缘设备的支持。这意味着,未来 Agent 将不再局限于云端服务器,而是可以运行在汽车、游戏机甚至机器人终端上。值得注意的是,短短数月,该 SDK 下载量突破 500 万次,再次证明了开发者对 " 简洁性 " 的青睐。
另一个制约生产力解放的直接命题,也被 Swami 关注到了。比如,为了解决当下 AI 普遍存在的 " 健忘症 "、即无法在长期交互中沉淀经验,Amazon Bedrock AgentCore Memory 推出后,则接入了全新的情景式记忆功能,能够让 Agent 从过往的上下文、推理过程、操作结果中持续学习,并将这些信息应用于后续交互。
在帮助 Agent 解决了 " 聪明 " 的能力后,亚马逊云科技也对其效率提升,集中下手。Swami 更是直言:" 效率关乎成本、规模与敏捷性。"

事实上,尽管通用的基础模型虽然 " 智商高 ",但在处理特定任务时,往往伴随着高昂的成本和延迟。由此,企业特定使用场景中," 小而美 " 的高质量定制模型已渐成主流。
这也是 AI 开发模式一种必然的 " 祛魅 " 过程。以往,行业迷信 " 参数至上 ",不过,Swami 的观点则强调专用性一定程度、一定场景下,无疑将会优于通用性。类似一家企业不需要一个样样稀松的通才,相反,去打造成百上千个精通业务细节的专才,或许才能真正释放生产力。
基于此,亚马逊云科技也打出了一套组合拳。比如,RFT 可让定制模型的准确率相比基础模型提升 66%。再加上 Amazon Nova Forge 开创了 " 开放式训练 " 的先河,允许企业在训练各阶段注入专有数据,让模型不仅懂通用知识,更懂企业的 " 行话 "。
以上这一切,也让定制化实现效率大幅提升成为一种未来的趋势。并且,在让 Agent 变得更聪明、更具效率的同时,如何确保成百上千个 Agent 被部署在生产链条的风险把控,也成为了一大重点。
对此,Swami 则进一步将失序把控的解决方案细化给出。除了先前介绍的 Amazon Bedrock AgentCore,为了进一步提升可靠性,亚马逊云科技还推出 Amazon Nova Act。这是一套用于构建可靠 UI 工作流程的全新服务,由定制版的 Amazon Nova 2 Lite 模型驱动。它结合了自动推理(Automated Reasoning)的数学逻辑验证,在早期测试中实现了高达 90% 的可靠性。
甚至,在现场演示的 " 反电诈 " 场景中,Agent 不仅能检查信用卡交易、合理提出怀疑,甚至能收集证据并协助报警。这种基于逻辑验证的严谨性,让 " 人机信任 " 不再是一句空话。
四、一条实实在在的道路
大会最后一天,亚马逊云科技发布了自身迄今为止性能最强、能效最高的 Amazon Graviton5 处理器。与上一代相比,基于 Graviton5 的全新 EC2 M9g 实例性能提升高达 25%,实现了单封装 192 核心的突破,并将 L3 缓存提升了 5 倍。一个直观的使用案例是,Apple 在迁移核心服务后,实现了成本降低 30%、性能提升 40% 的不错效益。
值得注意的是,目前亚马逊云科技新增 CPU 容量中连续第三年有超半数由 Graviton 驱动,EC2 头部 1000 家客户中已有 98% 受益于其显著的性价比优势,包括 Adobe、Airbnb、Atlassian、Epic Games、Formula 1 等。
不仅如此,在亚马逊云科技 re:Invent 2025 最终日,公司从 Amazon Graviton5 和 Amazon Trainium3 UltraServers 的极致能效展示,到 Amazon S3 Vectors 和 Amazon Lambda Managed Instances 重新定义了数据和无服务器的边界,并最终通过 Project Mantle 的系统级创新,再次完整地收束了过去数天公司想要强调的 AI 时代核心理念。
事实上,亚马逊云科技 2025 re:Invent 大会临近尾声时,公司则用大量基础设施产品的密集发布,重申了一个公司发展的核心命题:即 AI 不会颠覆基础设施,反而会让基础设施的安全性、成本和敏捷性等变得更加显著。
从这点上说,再次回顾亚马逊云科技 2025 年 re:Invent 大会,真正留下的或许不是一串令人眼花缭乱的产品清单,而是一张清晰、实用、贴切的企业发展蓝图。
从 Nitro 到 Graviton 再到 Trainium 的完整自研芯片堆栈,以及 Apple、Anthropic 等重量级客户背书,亚马逊云科技的企业竞争力壁垒中,一直有特殊且务实的底座:即当其他云厂商仍在试图证明自身 " 能做 AI" 时,亚马逊云科技则已经将视野聚焦到了用 " 安全性、可用性、成本可控 " 等,能直达商业核心的解决办法,再次证明了自己在 AI 规模化、可持续发展、盈利实现等方面,于行业内扮演了一个重要且不可或缺的角色。

值得注意的是,大会最后一天,亚马逊 CTO Dr. Werner Vogels 也完成了他在 re:Invent 的最后一场主题演讲,并谈到:AI 不会取代开发者,但停止进化的开发者则会被时代淘汰。
从这点上说,亚马逊云科技在 AI 的聚光灯下,或许选择了一条最不性感、最不显眼的道路。从过去到未来,亚马逊云科技始终在做的事情,核心仍在于为 AI 时代去 " 修筑铁路、铺设电网 ",这样看似 " 重资产、硬科技 " 的路径,表面显得笨重,内在则是在规模效应作用上去打造自身难以撼动的竞争壁垒。
2025 亚马逊云科技 re:Invent 中国行即将启幕:12 月 18 日开始,北京、上海、深圳、成都四城线下巡演及线上专场将同步开启,无论你是云计算新手还是技术老兵,都将从高阶演讲、实战内容、技术分享和专家互动中受益。点击【阅读原文】立即注册,抢占席位,把握 Agentic AI 时代的新机遇!
--THE END--


登录后才可以发布评论哦
打开小程序可以发布评论哦