《科创板日报》5 月 19 日讯(编辑 宋子乔) 当地时间 5 月 18 日,英伟达正式宣布,其首款专为 Agentic AI(智能体 AI)设计的 CPU —— Vera,已完成对 Anthropic、OpenAI、SpaceX AI 及甲骨文云的首批交付。

这款在今年 3 月 GTC 大会上亮相的重磅芯片,正式从英伟达的实验室走向了生产前线,首批交付过程充满了硅谷特有的仪式感。
上周五,英伟达副总裁伊恩•巴克亲自 " 开车送货 ",第一站是 Anthropic 位于旧金山 SoMa 区的办公室,其计算负责人詹姆斯•布拉德伯里接收了服务器;在 OpenAI 的总部,巴克甚至掏出螺丝刀,当场打开机箱盖展示内部结构;当天行程的终点是帕洛阿尔托的 SpaceX AI 办公室,埃隆•马斯克亲自签收,并在现场详细询问了核心数量、内存布局及散热方案,SpaceX AI 正计划将 Vera 用于强化学习工作负载与智能体仿真管线。



本周一,甲骨文产品管理负责人卡兰•巴塔在接收现场透露,"甲骨文云基础设施(OCI)计划从 2026 年开始部署数十万颗英伟达 Vera CPU。Agentic AI 需要在大规模下维持持续性能,Vera 的架构专为高吞吐推理设计,这正是我们为下一代企业 AI 提供动力所需的效率。"

Agent AI 并非仅靠 GPU 运行。每个代理沙箱、每次工具调用、每个编排层、每次长上下文检索操作都需要 CPU 处理。
Vera 旨在满足 Agent AI 对 CPU 的需求,黄仁勋在本届 GTC 大会上将其定位为公司 " 下一个数十亿美元级业务 "。
与传统 CPU 设计追求 " 核心数量 " 最大化不同,Vera 专为高吞吐推理、工具调用及代码生成设计。它搭载了 88 个英伟达自研的奥林巴斯(Olympus)核心,满载情况下单核性能较前代 Grace 提升 50%,内存带宽高达 1.2 TB/s,同时支持 FP8 精度,可直接承接 AI 推理与强化学习任务,无需 GPU 中转数据,可大幅提升 AI 流水线整体效率。
黄仁勋曾指出,当企业坐拥价值 500 亿美元的 GPU 时,绝不能让它们因为 CPU 处理速度慢而闲置。Vera 存在的意义,就是当 AI 智能体需要同时处理规划任务、检索长上下文或调用 API 时,以极致的单线程性能和能效,让昂贵的 GPU 满负荷运转。
另外,Vera 不仅是独立的 CPU 产品,它还将作为即将发布的 Vera Rubin 超级芯片平台的主机处理器,通过 NVLink-C2C 与两颗 Rubin GPU 配对,形成统一内存架构,以更高的能效为 AI 工厂供能。这种 "CPU+GPU" 异构协同的全栈 AI 算力方案,有望推动英伟达从单一 GPU 厂商向全栈 AI 计算平台提供商转型。
英伟达表示,Vera 的高速核心与互连设计能够以传统基础设施两倍的能效,完成向 GPU 馈送数据所需的调度、控制与数据搬移工作。


登录后才可以发布评论哦
打开小程序可以发布评论哦