(全球 TMT2024 年 9 月 18 日讯)亚马逊云科技宣布由英伟达 H200 GPU 提供支持的 Amazon Elastic Compute Cloud P5e(Amazon EC2 P5e)实例现已正式可用。亚马逊云科技是首个将英伟达 H200 GPU 用于生产环境的领先云提供商。与基于英伟达 H100 GPU 的 Amazon EC2 P5 实例相比,Amazon EC2 P5e 实例 GPU 内存容量提升 1.7 倍,GPU 内存宽带提升 1.5 倍。Amazon EC2 P5e 非常适用于复杂的大型语言模型 ( LLM ) 和多模态基础模型 ( FM ) 的训练、微调和推理,用于支持最苛刻和计算密集型的生成式 AI 应用,如问答、代码生成、视频和图像生成、语音识别等。
Amazon EC2 P5e 实例提供 8 个英伟达 H200 GPU,具有 1128GB 高带宽 GPU 内存,同时提供第三代 AMD EPYC 处理器,2TB 系统内存和 30TB 本地 NVMe 存储。Amazon EC2 P5e 实例还提供 3,200 Gbps 的聚合网络带宽并支持 GPUDirect RDMA,显著提升客户工作负载的性能、降低成本并简化运营。此外,亚马逊云科技还宣布将推出 Amazon EC2 P5en 实例,通过将英伟达 H200 GPU 与定制的第四代英特尔 Xeon 可扩展处理器相结合支持 PCle Gen5,将提供高达四倍的 CPU 和 GPU 之间的带宽,降低网络延迟,进一步提高工作负载性能。
登录后才可以发布评论哦
打开小程序可以发布评论哦