英伟达Vera CPU交付即爆单甲骨文承诺部署数十万颗

快科技 5 月 19 日消息，据媒体报道，英伟达宣布，其首款专为 Agentic AI（智能体 AI）设计的 CPU —— Vera，已完成对 Anthropic、OpenAI、SpaceX AI 及甲骨文云的首批交付。

Vera 专为满足 Agent AI 对 CPU 的严苛需求而打造。在本届 GTC 大会上，黄仁勋将其定位为公司 " 下一个数十亿美元级业务 "。

甲骨文产品管理负责人卡兰 · 巴塔透露："甲骨文云基础设施（OCI）计划从 2026 年开始部署数十万颗英伟达 Vera CPU。Agentic AI 需要在大规模下维持持续性能，Vera 的架构专为高吞吐推理设计，这正是我们为下一代企业 AI 提供动力所需的效率。"

与传统 CPU 追求 " 核心数量 " 最大化的设计理念不同，Vera 专为高吞吐推理、工具调用及代码生成而优化。

它搭载了 88 个英伟达自研的奥林巴斯（Olympus）核心，满载下单核性能较前代 Grace 提升 50%，内存带宽高达 1.2 TB/s。同时支持 FP8 精度，可直接承接 AI 推理与强化学习任务，无需 GPU 中转数据，大幅提升 AI 流水线的整体效率。

黄仁勋曾指出：当企业坐拥价值 500 亿美元的 GPU 时，绝不能让它们因为 CPU 处理速度慢而闲置。Vera 存在的意义，就是当 AI 智能体需要同时处理规划任务、检索长上下文或调用 API 时，以极致的单线程性能和能效，让昂贵的 GPU 满负荷运转。

此外，Vera 不仅是独立的 CPU 产品，还将作为即将发布的 Vera Rubin 超级芯片平台的主机处理器，通过 NVLink-C2C 与两颗 Rubin GPU 配对，形成统一内存架构，以更高能效为 AI 工厂供能。

这种 "CPU+GPU" 异构协同的全栈 AI 算力方案，有望推动英伟达从单一 GPU 厂商向全栈 AI 计算平台提供商转型。

英伟达表示，Vera 的高速核心与互连设计能够以传统基础设施两倍的能效，完成向 GPU 馈送数据所需的调度、控制与数据搬移工作。

【本文结束】如需转载请务必注明出处：快科技

责任编辑：鹿角

宙世代