盖世汽车讯 据外媒报道,为了教导自主机器人和车辆如何与物理世界互动需要大量高质量数据,英伟达(NIVIDIA)在 GTC 2025 大会上先不发布用于构建下一代物理 AI 的海量开源数据集,可以帮助研究人员和开发人员启动难度极高的物理 AI 项目。
图片来源:英伟达
开发人员可以直接使用这一商业级、预先验证的数据集进行模型预训练、测试和验证,也可以在训练后使用该数据集微调世界基础模型,从而加速部署之路。
初始数据集现已在 Hugging Face 上提供,为开发人员提供 15 TB 的数据,这代表着有超过 320,000 条用于机器人训练的轨迹,以及多达 1,000 个通用场景描述(OpenUSD)资产,包括 SimReady 集合。用于支持端到端自动驾驶汽车(AV)开发的专用数据也即将推出,其中包括 20 秒的各种交通场景片段,涵盖美国 1,000 多个城市和 24 个欧洲国家。
这个数据集将随着时间的推移而增长,成为世界上最大的统一开源的物理 AI 开发数据集。它可以用于开发 AI 模型,为安全操纵仓库环境的机器人、在手术过程中支持外科医生的人形机器人,以及可以在施工区等复杂交通场景中导航的 AV 提供动力。
英伟达物理 AI 数据集计划包含英伟达用于训练、测试和验证物理 AI 的现实世界和合成数据子集,用于 NVIDIA Cosmos 世界模型开发平台、NVIDIA DRIVE AV 软件堆栈、NVIDIA Isaac AI 机器人开发平台和 NVIDIA Metropolis 智慧城市应用程序框架。
早期应用机构包括加州大学伯克利分校的伯克利 DeepDrive 中心(Berkeley DeepDrive Center at the University of California, Berkeley)、卡内基梅隆大学安全 AI 实验室(Carnegie Mellon Safe AI Lab)和加州大学圣地亚哥分校的情境机器人研究所(Contextual Robotics Institute at University of California, San Diego)。
登录后才可以发布评论哦
打开小程序可以发布评论哦