智东西 07-24
自定义Llama 3.1模型的利器来了!NVIDIA打造生成式AI代工厂,还有加速部署的微服务
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

作者 | ZeR0

编辑 | 漠影

智东西 7 月 24 日报道,NVIDIA 宣布推出全新 NVIDIA AI Foundry 服务和 NVIDIA NIM 推理微服务,与刚推出的 Meta Llama 3.1 系列开源模型一起,为全球企业的生成式 AI 提供强力支持。

Llama 3.1 大语言模型有 8B、70B 和 405B 三种参数规模。模型在超过 16000 个 NVIDIA Tensor Core GPU 上训练而成,并针对 NVIDIA 加速计算和软件(无论是在数据中心、云以及配备 NVIDIA RTX GPU 的本地工作站或配备 GeForce RTX GPU 的 PC 上)进行了优化。

就像台积电是面向全球芯片企业的代工厂,NVIDIA 也打造了企业级 AI 代工厂 NVIDIA AI Foundry。

NVIDIA 创始人兼 CEO 黄仁勋谈道:"Meta 的 Llama 3.1 开源模型标志着全球企业采用生成式 AI 的关键时刻已经到来。Llama 3.1 将掀起各个企业与行业创建先进生成式 AI 应用的浪潮。NVIDIA AI Foundry 已经在整个过程中集成了 Llama 3.1,并能够帮助企业构建和部署自定义 Llama 超级模型。"

NVIDIA AI Foundry 由 NVIDIA DGX Cloud AI 平台驱动,由 NVIDIA 与全球领先的公有云共同设计,提供一种可用于快速构建自定义超级模型的端到端服务,旨在为企业提供大量计算资源,所提供的计算资源可随着 AI 需求的变化轻松扩展。

" 借助 NVIDIA AI Foundry,企业可以轻松创建和定制大家想要的最先进的 AI 服务,并通过 NVIDIA NIM 进行部署。"Meta 创始人兼 CEO 马克 · 扎克伯格说。

企业如果需要更多训练数据来创建特定领域的模型,可使用自有数据以及由 Llama 3.1 405B 和 NVIDIA Nemotron Reward 模型生成的合成数据,来训练这些超级模型,以提高准确性。拥有自己的训练数据的客户可以使用 NVIDIA NeMo 对 Llama 3.1 模型进行自定义,通过领域自适应预训练(DAPT)进一步提高模型的准确性。

NVIDIA 和 Meta 还一起为 Llama 3.1 提供了一种蒸馏方法,供开发者为生成式 AI 应用创建更小的自定义 Llama 3.1 模型。这使企业能够在更多加速基础设施(如 AI 工作站和笔记本电脑)上运行由 Llama 驱动的 AI 应用。

创建自定义模型后,企业就可以构建 NVIDIA NIM 推理微服务,以便在其首选的云平台和全球服务器制造商提供的 NVIDIA 认证系统上,使用自己选择的最佳机器学习运维(MLOps)和人工智能运维(AIOps)平台在生产中运行这些模型。

NIM 微服务有助于将 Llama 3.1 模型部署到生产中,其吞吐量最多可比不使用 NIM 运行推理时高出 2.5 倍。

从 ai.nvidia.com 即可了解适用于 Llama 3.1 模型的 NVIDIA NIM 推理微服务,以加快将 Llama 3.1 模型部署到生产级 AI 的速度。

将 Llama 3.1 NIM 微服务与全新 NVIDIA NeMo Retriever NIM 微服务组合使用,就能为 AI copilot、助手和数字人虚拟形象搭建先进的检索工作流。

通过使用全新 NVIDIA NeMo Retriever NIM 推理微服务来实现检索增强生成(RAG),企业可将自定义 Llama 超级模型和 Llama NIM 微服务部署到生产中,以提高响应准确性。

当与适用于 Llama 3.1 405B 的 NVIDIA NIM 推理微服务结合使用时,NeMo Retriever NIM 微服务能为 RAG 工作流中的开放和商业文本问答带来极高的检索准确性。

NVIDIA AI Foundry 结合 NVIDIA 软件、基础设施和专业知识与开放社区模型、技术和来自 NVIDIA AI 生态系统的支持。NVIDIA AI Enterprise 专家和全球系统集成商合作伙伴与 AI Foundry 客户一同加快从开发到部署的全过程。

专业服务公司埃森哲率先借助 NVIDIA AI Foundry,使用 Accenture AI Refinery 框架为自己以及希望所部署的生成式 AI 应用能够反映其文化、语言和行业的客户来创建自定义 Llama 3.1 模型。

医疗、能源、金融服务、零售、交通、电信等行业的企业已在使用适用于 Llama 的 NVIDIA NIM 微服务。首批使用面向 Llama 3.1 全新 NIM 微服务的公司有 Aramco、AT&T、优步等。

数百家提供企业、数据和基础设施平台的 NVIDIA NIM 合作伙伴现在能够将这些新的微服务集成到其 AI 解决方案中,为 NVIDIA 社区 500 多万开发者和 1.9 万家初创公司的生成式 AI 提供助力。

通过 NVIDIA AI Enterprise 即可获得 Llama 3.1 NIM 和 NeMo Retriever NIM 微服务的生产支持。NVIDIA 开发者计划会员将很快能够免费访问 NIM 微服务,以在他们首选的基础设施上进行研究、开发和测试。

方便易得、高性价比是推动企业采用 AI 的必要努力。近年来,NVIDIA 正通过推出 AI Foundry、NIM 微服务、自研多款高性能大模型等种种努力,来帮助企业更轻松地获取先进生成式 AI 模型的能力,满足其业务需求。

在 Llama 3.1 发布的同时,NVIDIA 推出一系列帮助企业快速自定义或应用部署 Llama 3.1 的工具,可见这家 AI 计算巨头对前沿产业变动的敏锐嗅觉和行动力。相比其他还在专注于芯片研发的公司,英伟达显然已经走到了更远的前方。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

逗玩.AI

逗玩.AI

ZAKER旗下AI智能创作平台

相关标签

ai nvidia 微服务 ceo 创始人
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论