量子位 前天
云计算一哥10分钟发了25个新品!Kimi和MiniMax首次上桌
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

从未见过如此凡尔赛的名场面。

云计算一哥亚马逊云科技CEO Matt Garman,在自家年度盛宴re:Invent 2025中,因为还要发布的新产品太多了,于是他在现场来了一句:

我挑战一下10 分钟内发布25 个产品!

毕竟是闻所未闻的举动,现场观众一下子就沸腾了起来。

然后,Garman 真的就以24 秒一个产品的速度,把新的计算、存储、安全、数据库和大数据相关的内容,一气呵成地给发布了出来。

或许很多小伙伴要问了,要不要这么赶?会不会太儿戏了些?

赶,是真的得赶;但儿戏,却绝非如此。

因为今年亚马逊云科技在短短 2 个多小时的时间里,一共发布了近 40 个新品。

这并不意味着刚才的 25 项内容不重要,而是前面的新发布更加劲爆——

围绕当下最火热的AI Agent,从算力到模型,从平台到应用,几乎你能想到、用到的内容都涵盖了进来。

若是用一个词来总结纵观整场发布会的感受,那或许就是实用

是能直击你在用 AI 大模型、AI Agent 过程中所有难题的 " 七寸 " 的那种。

接下来,我们就来一起看看前面的发布到底有多重磅。

(PS:先小小剧透一下,中国两款大模型被云计算一哥高调点名了 ~)

剧透新芯片 Trainium4,已是算力帝国之势

AI 的本质是算力密集型工程,而算力的性能、成本与部署灵活性,直接决定了企业能走多远。

亚马逊云科技深谙此道,在这场发布会上,它从三个维度彻底重构了 AI 算力的供给模式。

首先,是在芯片自研方面。

亚马逊云科技自研的 AI 芯片 Trainium,已经从概念产品成长为多亿美元级业务。据 Garman 透露:

亚马逊云科技已经部署了超过 100 万颗 Trainium 芯片,并以比业界最快 AI 芯片快 4 倍的速度快速上量。

而就在今天,Trainium3 Ultra Servers正式全面可用。

这款基于 3 纳米工艺的服务器,相较上一代 Trainium2,在计算性能上提升 4.4 倍,内存带宽提升 3.9 倍;更重要的是,在相同延迟下,每兆瓦电力可产出 5 倍以上的 AI Tokens。

除此之外,亚马逊云科技下一代的芯片也已经被曝光了出来——Trainium4

根据 Garman 介绍,Trainium4 相较于上一代,将带来每个维度上的巨大飞跃:FP4 计算性能提升 6 倍,内存带宽提升 4 倍,并拥有 2 倍于前代的高带宽内存容量,专为全球最大的模型训练需求而生。

与亚马逊云科技合作了长达 15 年之久的英伟达,这一次同样出现在了发布会中。

Garman 强调,亚马逊云科技是全球运行英伟达 GPU 最稳定、最可靠的云平台。他们甚至会深入到 BIOS 层面进行调试,可以防止 GPU 意外重启,这是其他云厂商所不具备的。

在此基础上,亚马逊云科技推出了搭载英伟达最新 GB200 NVL72 系统的P6e-GB300 实例,专门为训练超大规模模型的客户提供顶级算力。

包括 OpenAI 在内的顶尖 AI 公司,正在亚马逊云科技上运行由数十万颗芯片组成的集群,来支持 ChatGPT 和下一代模型的训练。

最后,还有一个彻底打破了公有云和私有数据中心边界的新产品——AI Factories

它可以允许客户在自己的数据中心内部署专属的亚马逊云科技 AI 基础设施。客户可以复用自己已有的机房空间和电力资源,同时无缝接入包括 Trainium、英伟达 GPU、SageMaker 和 Bedrock 在内的全套亚马逊云科技的 AI 服务。

这就意味着任何拥有自有机房的大型组织,都可以在不牺牲安全与控制权的前提下,享受到全球最顶尖的 AI 算力。

从 Trainium 的自研,到 GPU 超集群的运维,再到 AI Factories 的区域化复制,亚马逊云科技在算力供应链上的掌控力,的确已经逼近算力帝国的描述。

而且这种领先可以说是全栈的那种:芯片、网络、数据中心、一致性 API、模型托管、Agent 运行环境,每层都在构成自己的壁垒。

又有新模型发布,国产模型还被点名

如果说算力是土壤,那么我们可以把大模型比作是在此孵化的种子。

亚马逊云科技在这一层面上的解法,是构建一个开放、灵活、可深度定制的模型平台——Amazon Bedrock

Bedrock 的核心哲学是" 没有一个模型能统治一切 ",这也就是为什么亚马逊云科技会不断往里面扩中新大模型的原因了。

在这次发布会上,除了引入 Google 的 Gemma、NVIDIA 的 Nemotron 等业界知名模型外,一个细节尤其值得关注:

中国的KimiMiniMax,首次被纳入 Bedrock。

这标志着中国大模型正式通过亚马逊云科技这一全球最大云平台出海,进入全球开发者的视野。

在此生态之上,亚马逊云科技也推出了自家新的自研大模型——Amazon Nova 2 系列

整体来看,Amazon Nova 2 主要包含三个不同的类型:

Nova 2 Light:主打高性价比与低延迟,在指令遵循、工具调用、代码生成、文档信息抽取等关键任务上,其性能可与 Claude Haiku、GPT-4o-mini、Gemini Flash 等业界标杆比肩,甚至超越,而成本更具优势。

Nova 2 Pro:面向高度复杂的任务,在需要深度推理和精准工具使用的场景,如构建高级 Agent 时,表现尤为出色。Garman 称其在多项 AI 分析基准测试中,超越了 GPT-5.1、Gemini 3 Pro 和 Claude 4.5 Sonnet。

Nova 2 Sonic:专注于实时、类人的语音对话交互,大幅优化了延迟,并支持更广泛的语言。

如果说 Nova 2 解决了 " 多 " 和 " 快 " 的问题,那么Nova 2 Omni则是解决了 " 融 " 的问题。

它是业界首个支持文本、图像、视频、音频四模态输入,并能生成文本与图像的统一推理模型。

这意味着,一个模型就能理解一场包含演讲、PPT、演示视频的完整发布会,并自动生成图文并茂的摘要报告。

这种多模态融合能力,自然是构建真正理解复杂现实世界 Agent 的关键一步。

然而,所有这些通用模型的终极瓶颈在于:它们不了解你的企业,你的数据、流程、行业知识才是核心竞争力。

为此,亚马逊云科技祭出了杀手锏——Amazon Nova Forge

Nova Forge 引入了开放训练模型(Open Training Models)的概念。

它允许企业客户获取 Nova 模型在不同训练阶段的检查点(Checkpoint),将自己的私有数据(如产品设计文档、失败案例、制造约束等)与亚马逊云科技的通用训练数据集进行融合。

如此一来,就可以训练出一个既保留了强大通用推理能力,又深度理解本企业独特知识的专属模型(Novella)。

Reddit的案例生动说明了其中所蕴含的价值。

通过在预训练阶段就融入其社区特定的内容安全数据,Reddit 成功训练出一个能精准识别违规内容的专属模型,不仅达到了准确性目标,还大幅简化了部署运维。

这就很好地解决了传统微调中模型灾难性遗忘的难题,让企业真正拥有了自己的行业专家 AI。

Agent,Agent,还得是 Agent!

AI Agent,无疑是这次 re:Invent 中的关键词之一。

亚马逊云科技对此也是非常之重视,几乎把非常大篇幅放在这里。Garman 明确表示:

AI 助手的时代正在被 AI Agent 取代;未来每家公司会运行数十亿个 Agent。

但企业要想真正把这些 AI Agent 给用透,就必须解决两大难题:如何高效构建 Agent?如何确保它们行为可控、结果可信?

为此,亚马逊云科技给打了个样。

在开发者层面,Garman 先是针对其Kiro编程助手,推出了新的三个 Agent。

首先是Kiro Autonomous Agent(自主 Agent)。

它不再是一个简单的代码补全工具,现在可以充当一个能长期运行、自主规划、并行执行复杂开发任务的 " 虚拟同事 "。

例如,当需要升级一个被 15 个微服务共用的关键库时,传统方式需要开发者逐个仓库操作。

而 Kiro Autonomous Agent 会自动分析所有依赖,生成 15 个经过完整测试、可直接合并的 Pull Request。它会记住开发者的反馈,并在后续任务中持续学习和改进。

其次是AWS Security Agent(安全 Agent)。

它将安全左移(Shift Left)做到极致,能主动审查设计文档,在代码提交(Pull Request)时扫描漏洞,并能按需发起一键式渗透测试。

这个 Agent 可以说是把过去昂贵、低频、滞后的安全审计,变成了开发流程中实时、高频、自动化的环节。

最后是AWS DevOps Agent(运维 Agent),一个 7x24 小时在线的超级 SRE。

当系统告警时,它能利用对应用拓扑和部署管线的深度理解,快速定位根因(例如,一个由 CDK 代码错误导致的 Lambda IAM 策略问题),并提出修复建议,甚至能推荐预防措施,避免问题复发。

这三个 Agent,覆盖了软件开发全生命周期,将开发者从重复、繁重、易错的体力劳动中解放出来,让他们能专注于更高价值的创造性工作。

内部数据显示,一个 6 人团队借助 Kiro,仅用 76 天就完成了原本需要 30 人干 18 个月的架构重构项目(据说是重写了一遍 Bedrock)。

当然,并非所有企业都有能力从零构建 Agent。为此,亚马逊云科技提供了强大的平台能力:

AWS Transform Custom,帮助企业消灭技术债。

开发者可以创建自定义的代码转换 Agent,将任何老旧的代码、框架、API(甚至是公司内部独有的)自动迁移至现代化平台。客户 QAD 利用它,将原本需要 2 周的迁移工作压缩到 3 天内完成。

Policy in AgentCore,这是解决 Agent 失控问题的关键。

它允许管理者用自然语言(如 " 禁止向退款金额超过 1000 美元的客户退款 ")定义策略。

这些策略会被转化为安全的 Cedar 策略语言,在 Agent 每次尝试调用工具或访问数据前进行毫秒级实时校验。这就像给 Agent 装上了不可绕过的电子围栏,让它在拥有强大自主性的同时,行为边界清晰可控。

AgentCore Evaluations,解决了 Agent 不可信问题。

传统上,评估 Agent 输出质量(如准确性、无害性、品牌一致性)需要组建专业数据科学团队构建复杂评估管线。

AgentCore Evaluations 将这一切自动化,提供 13 种预置评估器,并能将评估结果直接集成到 CloudWatch 中。企业可以持续监控 Agent 在生产环境中的表现,确保其输出始终符合预期。

从构建、部署到治理、评估,亚马逊云科技为 Agent 的全生命周期提供了闭环工具链,让企业敢用、能用、用好 Agent。

目标很明确:就是死磕怎么 " 用好 "

回顾整场发布会,亚马逊在 AI 大模型、AI Agent 时代的发展路径其实是非常清晰且朴素的——

如何把它们给用好。

即使把时间线再往回拨两年,其战略依旧是如此:从一开始就并没有过度深入卷大模型,而是死磕底层架构和应用。

用亚马逊云科技自己的话来说就是" 客户需要什么我就做什么 "

算力成本与部署难题?用自研 Trainium 芯片、与英伟达的深度合作、以及开创性的 AI Factories 来解决。

模型无法理解企业私有知识?用开放的 Bedrock 生态、强大的 Nova 系列,以及革命性的 Nova Forge 来解决。

Agent 不可控、不可信、难构建?用 Kiro 前沿智能体、Transform Custom、Policy 和 Evaluations 等一系列工具来解决。

这三层架构构成了一套组合拳,直击 AI 价值落地的 " 七寸 "。它所传递的核心信息同样非常清晰:

AI 的未来,不在于单点技术的突破,而在于一整套端到端、安全、可靠、可规模化的企业级基础设施。

正如索尼和 Adobe 在演讲中所分享的,真正的转型成功,源于将数据和应用深度融入云平台,从而获得了应对不确定性的敏捷性和韧性。

这或许就是 Garman 在发布会中所提及的那个拐点:从 AI 的 " 技术时代 ",正式迈入 AI 的 " 价值时代 "。

One More Thing:

今年全球来到拉斯维加斯参加 re:Invent 的人数达到了 6 万人!

光是今天主论坛现场,就已经人人人的状态了,来感受一下这个 feel:

错过了今天 re:Invent 的精彩内容?

别急,亚马逊云科技 re:Invent 中国行即将启幕!

四大城市巡演 + 北京主会场直播,无论你是云计算新手还是技术老兵,都将从高阶演讲、实战内容、技术分享和专家互动中受益。立即注册,抢占席位,把握 Agentic AI 时代的新机遇!

https://events.amazoncloud.cn/reinvent-online-20251218?trk=811631fa-539a-41c3-8fed-f23e4f9919dc&sc_channel=el

一键三连「点赞」「转发」「小心心」

欢迎在评论区留下你的想法!

—    —

点亮星标

科技前沿进展每日见

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

ai 云计算 亚马逊云 数据库 大数据
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论