智东西 前天
亚马逊杀疯了!连甩十大重磅发布,揭Agent大招、自研芯进展
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

智东西

作者 | 骏达 程茜

编辑 | 心缘

全球最大云计算巨头的 AI 武器库,又迎来重磅更新!

智东西拉斯维加斯 12 月 2 日报道,今日,在年度云计算产业盛会 AWS re:Invent 上,亚马逊云科技(AWS)连甩一系列重磅 AI 新品,包括最新 AI 芯片 Trainium4、基于其首款 3nm AI 芯片的 Amazon EC2 Trainium3 UltraServers、第二代自研大模型 Amazon Nova 2 系列,以及大量 Agent 开发利器。

从 AI 基础设施、AI 推理平台、企业数据管理到智能体开发工具、前沿智能体,通通迎来一大波升级。智东西作为受邀现场参会的媒体,从大会前排带来超全干货报道。

Amazon Nova 2 系列首发 4 款模型:经济高效推理模型 Lite,高智能推理模型 Pro,语音转语音的实时拟人对话式 AI 模型 Sonic,以及面向多模态推理和图像生成的统一模型 Omni。

其中,Nova 2.0 Pro Preview 在指令跟随、智能体工具使用榜单中,性能超过了 GPT-5 mini、GPT-5.1、Claude Opus 4.5、Gemini 3 Pro Preview 等前沿模型。

值得一提的是,Amazon Bedrock 新增 18 款全托管开源模型,其中包括 4 款国内顶尖模型:阿里 Qwen3-NEXT 和 Qwen3-VL、月之暗面 Kimi K2 Thinking、稀宇科技 MiniMax M2。

其他新增的前沿模型还有谷歌 Gemma 3、英伟达 Nemotron、OpenAI gpt-oss-safeguard、Mistral AI 的 Mistral Large 3 和 Ministral 3 等。

总体来看,今日十大重要发布包括:

1、P6e 新实例:采用英伟达 GB300 NVL72 系统。

2、AWS AI Factories 服务:专用客户定制 AI 基础设施,由 AWS 快速构建和管理。

3、AWS Trainium4 自研 AI 芯片:第四代自研 AI 芯片,相比上一代带来 6 倍的计算性能(FP4)、3 倍的 FP8 性能、4 倍的内存带宽、2 倍的内存容量,并可通过 NVLink Fusion 和 UALink 实现纵向扩展。

4、Amazon EC2 Trainium3 UltraServers:由 AWS 首款 3nm AI 芯片 Trainium3 提供支持,提供大规模 AI 训练和推理的高性价比,单集群可连接 144 张 Trainium3 芯片,算力达 362PFLOPS(FP8),带宽为 706TB/s,相较上一代带来 4.4 倍计算性能、3.9 倍高内存带宽、5 倍的每百万瓦 token 数。

5、Amazon Bedrock 平台:新增 18 款开源模型,模型数量过去一年翻倍增长,已拥有超过 10 万客户,其中 50 多家客户均使用了超过 1 万亿个 token。

6、Amazon Nova 2 系列自研模型:包括 Lite、Pro、Sonic、Omni。

7、Amazon Nova Forge 服务:支持企业访问 Nova 模型在不同阶段的训练检查点,并将自有数据与亚马逊的训练数据集混合,构建定制前沿模型。

8、AgentCore 开发工具:Policy in AgentCore(预览版),使用细粒度权限策略,给 agent 行动设置明确边界;AgentCore Evaluations(预览版),使用评估器,根据现实世界行为来持续检查 agent 质量。

9、4 款前沿智能体:AWS Transform Custom(专为企业开发工作流程设计),Kiro autonomous agent(自主开发复杂编程任务)、AWS Security Agent(预览版,保护全开发生命周期安全)、AWS DevOps Agent(预览版,加快事件响应速度并提高系统可靠性)。

10、7 款新实例、6 项 Amazon S3 存储升级、5 项 Amazon RDS 数据库更新、3 项计算与加速优化新功能、4 项管理与治理新功能。

一、新基建:全新 AI 芯片 Trainium4 性能飙 6 倍,帮企业定制专属 AI 基础设施

加曼称,亚马逊云科技是第一家在云中提供英伟达 GPU 的公司,其与英伟达合作已超过 15 年,也是迄今为止运行 GPU 集群最多的公司。

1、基于英伟达 GB300 NVL72 打造 P6e-GB300

今天,亚马逊云科技新发布采用英伟达最新的 GB300 NVL72 系统的 P6e-GB300,相比 P6e-GB200,新实例 GPU 内存容量提升至 1.5 倍,FP4 计算性能(无稀疏)提升至 1.5 倍。

英伟达在亚马逊云科技上运行其生成式 AI 集群。OpenAI 也在亚马逊云科技上基于 EC2 Ultra Servers 集群支撑 ChatGPT 运行及训练下一个模型,部署了数十万张 GB200。加曼透露这些处理器很快将会变为 GB300。

本月初,亚马逊云科技还与沙特阿拉伯 AI 创企 Humain 建立了合作伙伴关系,计划在沙特的数据中心设施中提供、部署和管理至多 15 万个 AI 加速器。

2、AWS AI Factories 满足企业私有化部署需求

为满足企业的私有化部署需求,今天亚马逊云科技宣布推出 AWS AI Factories。基于这一平台,客户能在自己的数据中心部署专用 AI 基础设施,然后使用亚马逊云科技的基础设施和服务。

3、Amazon EC2 Trainium3 UltraServers

目前,Amazon Bedrock 上运行的所有推理工具都由 Trainium 提供支持,亚马逊云科技已经部署了 100 万颗 Trainium 芯片,Trainium2 的量产速度是其曾经芯片量产速度的 4 倍。

加曼称,亚马逊云科技的 Trainium 系列芯片虽然以 " 训练 " 命名,但这些芯片其实也适用于推理用途。目前,亚马逊云科技上的许多 AI 推理服务都是在 Trainium 芯片上运行的,包括 Claude 的前沿模型。

亚马逊云科技还围绕 Trainium 打造了一个超大规模系统,名为 Project Rainier,用于 Anthropic 下一代 Claude 模型的训练。

这一项目的规模十分庞大,加曼称,如果过去大家常说单个数据中心已经成了新的计算机,Project Rainier 则更进一步,让由多个数据中心组成的园区,构成了一个计算机。

Project Rainier 将会不断扩大规模,最终支持高达 30 个单体数据中心,用掉 1.1GW 的电力,托管超过 50 万个 Trainium2 芯片。相关计算设备会使用超过 100 万个的高速连接器件,通过 AWS EFA 网络实现安全、可靠的连接。

亚马逊云科技于去年发布了 Trainium3 芯片,今天,加曼宣布 Amazon EC2 Trn3 UltraServers 服务器已经广泛可用。与上一代产品相比,该服务器可提供 4.4 倍的算力和 3.9 倍的内存带宽。

值得注意的是,Amazon EC2 Trn3 UltraSevers 在能效比上也有提升,每兆瓦所处理的 token 数量达前代产品的 5 倍。

4、下一代 AI 芯片 Trainium 4

加曼还透露,亚马逊云科技的下一代 AI 芯片 Trainium 4 已深入设计阶段。Trainium4 预计能提供 6 倍的 FP4 性能,4 倍的内存带宽,2 倍的内存容量,并支持通过 NVLink Fusion 和 UALink 进行扩展。

二、新模型:阿里、Kimi、MiniMax 模型上架,第二代自研模型 Nova 2 四弹齐发

亚马逊云科技 Amazon Bedrock 推理平台已经拥有超过 10 万客户,使用其处理超 1 万亿个 token 的企业客户已超过 50 家。

亚马逊云科技一直以来的信条就是 " 选择至关重要(Choice Matters)",这也适用于模型的选择。加曼称,亚马逊云科技认为 AI 的未来不会仅由 1 个模型统治,过去 1 年,Amazon Bedrock 上提供的模型数量已经翻倍,DeepSeek、Qwen 等中国模型也在支持范围之内。

Amazon Bedrock 还在今天新增了 18 款全托管开源模型,包括 Qwen3-Next-80B-A3B、Qwen3-VL-235B-A22B、Kimi K2 Thinking、MiniMax M2 等中国模型。此外,谷歌 Gemma、英伟达 Nemotron 以及全新的 Mistral Large 3 和 Ministral 3(3B、8B 和 14B 版本)等模型也登陆 Amazon Bedrock 平台。

亚马逊云科技还发布第二代自研模型家族 Nova 2 系列,推出了 4 款新模型:Lite、Pro、Sonic 和 Omni。

Nova 2 Lite 是一款快速且经济高效的推理模型,适用于各种类型的工作负载,拥有不错的指令遵循、工具调用、信息提取、代码生成等能力。Nova 2 Lite 在上述四大领域的能力基本全面超越了 Claude Haiku 4.5、GPT-5 mini、Gemini 2.5 Flash 等轻量级模型,仅在编程能力上略逊于 GPT-5 mini。

Nova 2 Pro 是 Nova 系列中最智能的推理模型,支持文字、图像、视频、语音四种模态输入和文本模态输出,适用于高度复杂的工作负载,尤其是 Agent 场景。在两项 Agent 基准测试中,其表现已经超过了 GPT-5.1(high)、Gemini 3 Pro Preview(high)等前沿模型。

Nova 2 Sonic 则是亚马逊云科技的下一代语音转语音模型,支持文本和语音两个模态的输入输出,能为 AI 应用提供实时、类人的对话式 AI 体验。在语音理解和推理任务上,其性能已经超过了 GPT Realtime、Gemini 2.5 Flash 等。

Nova 2 Omni 是 Nova 系列的新物种,也是业界首个支持文本、图像、视频和音频输入,并支持文本和图像生成输出的推理模型。不过,亚马逊云科技尚未公布其基准测试成绩。

三、新服务:开放 Nova 模型训练检查点,帮企业训出专属前沿模型

加曼谈道,AI 需要拥有理解公司数据的能力,才能真正为公司和客户带来巨大价值。

由于数据具有独特性,企业往往不希望自己的专有数据被嵌入到第三方模型中,供他人使用。过去,业内让企业数据和模型结合最常用的技术是 RAG 或向量数据库,但这无法让模型真正理解数据。想要教会模型理解行业知识,还是需要定制模型。

然而,如果从零开始定制模型是极为昂贵的,企业没有足够数据、足够算力打造出强大的通用智能。

如果在开源模型的基础上,通过微调、强化学习等方式打造行业模型,则有可能出现其他领域性能下降的风险。

亚马逊云科技的解决方案,是 Amazon Nova Forge。Nova Forge 引入了 " 开放式训练模型(Open Training Model)" 的概念。

通过 Nova Forge,企业可以独家访问各种 Nova 模型的训练检查点,并在模型训练的任意阶段,将自己的专有数据与亚马逊创建的训练数据集混合。这使得企业能够产出一个深度理解企业信息的模型,同时不会遗忘模型已训练的核心信息。

Nova Forge 还提供了使用远程奖励函数和强化学习微调的能力,以进一步改进模型,让企业可以将真实环境集成到训练循环中。由于基础模型已经理解业务,这些后训练技术实际上会变得更加有效。

亚马逊云科技已经和不少企业试点了 Nova Forge 服务。索尼便通过 Nova Forge,对 Nova 2 Lite 模型进行了微调,使其适用于索尼自身的业务和运营。模型在引用一致性和文档依据等任务上表现优于基准模型,索尼的目标是借此将索尼合规审查和评估流程的效率提升 100 倍。

四、新工具:给 Agent 开发设限和打分

今天,亚马逊云科技宣布 Amazon Bedrock AgentCore 新增两项新功能,帮助开发者快速构建 Agent。自 AgentCore SDK 预览版发布以来,其在 5 个月内下载量已超过 200 万次。

此前,亚马逊推出了为 Agent 设计的核心工具集 AgentCore,包含部署、代码解释器、托管环境等诸多能力。在此基础上,亚马逊推出 Policy in AgentCore 预览版和 AgentCore Evaluation 预览版。

Policy in AgentCore 允许开发者在 AgentCore Gateway 工具调用运行前拦截,使用带有细粒度权限的策略,为 Agent 行为定义明确的界限,如使用哪些工具、如何使用工具,开发者也可以通过自然语言创建标准,如 " 报销金额大于 1000 美元时,就阻止退款 " 等。

AgentCore Evaluation 是一项全托管服务,帮助开发者持续监控和分析基于真实行为的 Agent 表现。开发者可以使用内置评估器来衡量常见的质量维度,如正确性、帮助性、工具选择准确性、安全性、目标成功率和上下文相关性,还可以创建基于模型的定制评分系统,根据自己选择的提示和模型进行业务定制评分。

所有 AgentCore 的评估结果都会在亚马逊统一监控平台 CloudWatch 被呈现。开发者还可以设置评估分数的警报和警报,主动监控 Agent 质量,并在指标超出可接受阈值时作出响应。

亚马逊此前构建了 Amazon Quick 和 Amazon Connect 两个 Agent 方案。

首先是 Amazon Quick,可以帮助员工在几分钟内将观点转换成行动,指导深度研究和获得详尽分析,其会从获取信息整理出详细的研究报告;员工还可以创建小型 Agent,帮助自己处理日常重复性工作。几周前,亚马逊在公司内部发布了 Amazon Quick,目前其已拥有数十万用户。

其次是 Amazon Connect,加曼谈到在亚马逊内部税务团队中的一个案例,该团队创建了一个 Agent,帮助其汇聚所有税务数据来源、深入研究税法政策变化。该 Agent 的另一个应用场景是客户服务,可以将 AI 引入企业的联络中心。Amazon Connect 业务的年度经常性收入已经超过 10 亿美元。

五、新 Agent:加速开发、优化编程、保护安全、增强可靠

加曼认为,对于试图快速现代化其应用程序的开发团队来说,目前最大的痛点之一就是处理技术债。在美国,技术债务每年给企业造成总计 2.4 万亿美元的损失,如今 70% 的 IT 预算都被用于维护遗留系统。

此前,亚马逊云科技已经推出了 AWS Transform,通过 AI 实现转换流程的降本增效。在此基础上,AWS 今日推出了 AWS Transform Custom,这一智能体帮助用户创建自定义代码转换智能体,以实现任何代码、API、框架、运行时或编程语言的翻译和现代化。

例如,全球知名 ERP 软件公司 QAD 便是用 AWS Transform,将原本需要至少需要两周才能完成转换的项目,压缩至 3 天。

今年早些时候,亚马逊云科技发布了面向专业开发者的 AI IDE "Kiro"。加曼称,已经有数十万开发者在使用 Kiro,有开发者感叹,用了 Kiro 之后,自己在过去 5 个月内交付的代码,比过去 10 年还要多。上周,亚马逊已经把 Kiro 定为该公司的官方 AI 开发环境。

为了进一步加强开发流程的自动化程度,亚马逊云科技发布了全新的三个前沿智能体,让 Kiro 在自主性、大规模可扩展和长期运行等领域的表现进一步增强。

Kiro Autonomous Agent 是一个与开发工作流并行运行的自主开发智能体。它就像团队的一名额外成员,能独立处理复杂任务,让工程师专注于核心创意。开发者只需指派一个复杂的、目标导向的任务,它能自行规划、分解并执行所有必要步骤,直到交付可用代码。

这一 Agent 还会越用越聪明,能长期、深度地理解代码库、团队规范和过往决策,从每一次互动中学习,形成 " 集体记忆 ",并应用所学知识到后续任务中。

AWS Security Agent 则是一个持续、主动、内置的 AI 安全专家。它能在设计阶段主动审查文档,确保安全性;在编程过程中扫描代码漏洞,并直接集成到 GitHub PR 中,为开发者提供即时、可操作的修复建议。

这一 Agent 还可以将渗透测试自动化,将传统的、昂贵且周期长的渗透测试,转变为可按需启动、快速完成的自动化、持续验证过程。

AWS DevOps Agent 则将运维工作自动化,能自动诊断并修复问题。当警报触发时,DevOps Agent 会立即自动响应,诊断问题的根本原因,提供修改意见和修改方案,并交由工程师审查和批准。

六、新实例、新存储、新数据库、新加速、管理与治理

加曼最后用 10 分钟公布了 25 个新发布。

7 款新实例:搭载第五代 AMD EPYC 处理器的 X8i Instances,内存增加超 50%;搭载第五代 AMD EPYC 处理器的 X8aedz Instances,计算性能是前一代 X2iezn 实例的两倍;搭载第五代 AMD EPYC 处理器的 C8a Instances,性能提升 30%,性价比提升 19%;搭载英特尔至强 6 的 C8ine Instances,实例配置每个 vCPU 的数据包性能可比上一代 C6in 实例提升 2.5 倍;搭载第五代 AMD EPYC 处理器的 M8azn Instances,计算性能是上一代 M5zn 实例的 2 倍。

还有两款采用最新苹果硬件的新实例:EC2 M3 Ultra Mac Instances、EC2 M4 Max MacInstances。

面向开发者,亚马逊云科技推出 Lambda durable functions(持久函数),开发者可以利用内置的自动恢复功能构建长期运行的工作负载。

存储方面,包括将 S3 最大对象大小从 5TB 提高到 50TB,增加 10 倍;亚马逊 S3 的数据管理功能 S3 Batch Operations 更新,在 200 亿个对象的规模下,完成作业的速度提升 10 倍;为 S3 Tables 提供智能分层,节省 80% 存储成本;S3 Tables 支持 AWS 区域和账户间自动复制;扩展 Amazon S3 接入点,支持 Amazon FSx for NetApp ONTAP;用于存储和查询向量的对象存储 S3 Vectors 全面上市;利用 GPU 提升向量索引构建效率,速度提升 10 倍,仅需 1/4 成本。

计算与加速优化新功能,Amazon EMR Serverless 提供 Amazon EMR on EKS,允许用户在不预先配置或管理存储的情况下运行大数据工作负载。

Amazon RDS 数据库的更新包括:RDS for Oracle 和 RDS for SQL Server 扩展存储容量、RDS for SQL Server 的 CPU 优化选项、对 SQL Server 开发者版本的支持,以及数据库节省计划。

管理与治理相关的新发布包括:为 ECS 和 EC2 新增 GuardDuty 扩展威胁检测功能、提供近乎实时分析及风险优先级排序功能的 Security Hub 安全中心、CloudWatch 统一数据管理和分析功能。

结语:Agent 开发已成加速创新的大势所趋

在主题演讲中,加曼多次强调了 Agent 的重要性:Agent 是企业从 AI 投资中看到实质性商业回报的地方。而为 Agent 系统、应用开发构建新的模块,需要性能更强的 AI 基础设施、推理平台、企业数据、构建和部署 Agent 的工具。

Agent 可自主感知业务需求并依据需求智能适配业务流程、动态调整执行策略,高效匹配业务场景的核心诉求,其已经成为释放 AI 价值的重要载体。亚马逊云科技在扩展加速计算产品线的同时,亦在不断优化 Agent 开发和部署工具,推出满足开发者多元化工作负载需求的新平台、新工具。

据加曼回顾,今年第三财季,亚马逊云科技的年化收入已经达到 1320 亿美元,同比增长超 20%。

过去一年,亚马逊云科技增加了 3.8GW 数据中心容量。如今,亚马逊云科技拥有全球规模最大、部署最广泛的 AI 云基础设施,全球数据中心网络覆盖 38 个地区、120 个可用性区域,还宣布再增加 3 个地区。

亚马逊云科技已经与全球顶尖的大模型公司建立合作,在其平台陆续上架全球主流开源模型,下一步的重点,显然已经是如何帮助更多客户将 Agent 落地到真实业务中,产生更广泛的商业价值。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

ai芯片 aws 英伟达 基础设施
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论