快科技 5 月 19 日消息,据媒体报道,英伟达宣布,其首款专为 Agentic AI(智能体 AI)设计的 CPU —— Vera,已完成对 Anthropic、OpenAI、SpaceX AI 及甲骨文云的首批交付。
Vera 专为满足 Agent AI 对 CPU 的严苛需求而打造。在本届 GTC 大会上,黄仁勋将其定位为公司 " 下一个数十亿美元级业务 "。
甲骨文产品管理负责人卡兰 · 巴塔透露:"甲骨文云基础设施(OCI)计划从 2026 年开始部署数十万颗英伟达 Vera CPU。Agentic AI 需要在大规模下维持持续性能,Vera 的架构专为高吞吐推理设计,这正是我们为下一代企业 AI 提供动力所需的效率。"
与传统 CPU 追求 " 核心数量 " 最大化的设计理念不同,Vera 专为高吞吐推理、工具调用及代码生成而优化。
它搭载了 88 个英伟达自研的奥林巴斯(Olympus)核心,满载下单核性能较前代 Grace 提升 50%,内存带宽高达 1.2 TB/s。同时支持 FP8 精度,可直接承接 AI 推理与强化学习任务,无需 GPU 中转数据,大幅提升 AI 流水线的整体效率。
黄仁勋曾指出:当企业坐拥价值 500 亿美元的 GPU 时,绝不能让它们因为 CPU 处理速度慢而闲置。Vera 存在的意义,就是当 AI 智能体需要同时处理规划任务、检索长上下文或调用 API 时,以极致的单线程性能和能效,让昂贵的 GPU 满负荷运转。
此外,Vera 不仅是独立的 CPU 产品,还将作为即将发布的 Vera Rubin 超级芯片平台的主机处理器,通过 NVLink-C2C 与两颗 Rubin GPU 配对,形成统一内存架构,以更高能效为 AI 工厂供能。
这种 "CPU+GPU" 异构协同的全栈 AI 算力方案,有望推动英伟达从单一 GPU 厂商向全栈 AI 计算平台提供商转型。
英伟达表示,Vera 的高速核心与互连设计能够以传统基础设施两倍的能效,完成向 GPU 馈送数据所需的调度、控制与数据搬移工作。

【本文结束】如需转载请务必注明出处:快科技
责任编辑:鹿角


登录后才可以发布评论哦
打开小程序可以发布评论哦