← 返回全部数据集

NVIDIA GR-1 仿真数据集

开源

NVIDIA

NVIDIA 围绕 GR-1 人形机器人发布了多个仿真数据集,用于训练和微调 GR00T 系列视觉-语言-动作(VLA)基础模型:

① Arena-GR1-Manipulation-Task(桌面操作仿真)
基于 Isaac Lab Arena 框架,包含 50 条 GR-1 开微波炉任务仿真轨迹,提供标注版和增强版两种 HDF5 格式,支持转换为 LeRobot 格式用于 GR00T N1.5/N1.6 策略训练。
下载:https://huggingface.co/datasets/nvidia/Arena-GR1-Manipulation-Task

② GR00T-Teleop-Sim(Robocasa GR1 Tabletop Tasks)
1,000 条仿真遥操作轨迹,覆盖 24 个桌面操作任务,使用 GR-1 上半身控制在 Robocasa 仿真环境中采集。
包含 44 维关节状态、44 维动作向量、256×256 20fps RGB 视频和语言指令。
HDF5 格式约 14GB,LeRobot 格式约 39GB。协议:CC BY-NC 4.0。
下载:https://huggingface.co/datasets/nvidia/PhysicalAI-Robotics-GR00T-Teleop-Sim (含 "robocasa-gr1-tabletop*" 子集)

③ GR00T-X-Embodiment-Sim(GR1 子集)
TB 级大规模多具身仿真库中的 GR-1 数据,包含 gr1_full_upper_body.Pouring(上半身倾倒)、gr1_arms_waist.CuttingboardToCardboardBox(取放装箱)等子集。
下载:https://huggingface.co/datasets/nvidia/PhysicalAI-Robotics-GR00T-X-Embodiment-Sim

配套 GR00T 训练框架:https://github.com/NVIDIA/Isaac-GR00T

机构
NVIDIA
规模
1,050+ 仿真轨迹(Arena 50 + Teleop-Sim 1,000)+ GR00T 大规模仿真库(TB 级)
许可证
CC-BY-4.0 / CC BY-NC 4.0(按子集不同)
机器人类型
人形机器人 仿真
任务类型
操作 抓取
发布年份
2024
数据模态
RGB、仿真状态、动作、视觉、深度
🤖 仿真生成(Isaac Sim + Robocasa)✅ 自动标注(含语言指令)💻 仿真📊 有数据划分

VLA 框架兼容性

🧠 GR00T N1

数据格式

存储格式HDF5 + LeRobot 格式
数据规模14GB ~ TB 级(按子集不同)
压缩方式无特殊压缩
文件布局HDF5 + LeRobot 双格式;按子集分目录(Arena/Teleop-Sim/X-Embodiment)
索引方式LeRobot meta/info.json + HDF5 内部 attribute
格式版本HDF5 v2.0 + LeRobot Parquet v3.0
episode
step
observation
action(LeRobot 兼容)

快速上手

加载数据

# LeRobot 格式加载
from lerobot.datasets import LeRobotDataset
dataset = LeRobotDataset('nvidia/Arena-GR1-Manipulation-Task')
# 或直接下载 HDF5
import h5py
with h5py.File('arena_gr1_demo.hdf5', 'r') as f:
    actions = f['actions'][:]

依赖库

leroboth5pytorch

预处理说明

HDF5 + LeRobot 双格式;Arena 50 + Teleop-Sim 1,000

数据内容

传感器规格

RGB
深度
仿真状态
关节状态
动作

数据统计

场景数Isaac Sim / Robocasa 仿真环境:开微波炉、取放装箱、桌面物品操作等
物体数微波炉、杯子、纸盒、罐头、瓶子等日常物品
任务数26+ 种仿真操作任务类型
轨迹/片段数1,050+ 仿真轨迹(不含 GR00T-X-Embodiment TB 级数据)

标注信息

语言指令动作标签

相关链接

采用的数据标准

相关数据集

讨论

AI 助手
输入需求,AI 帮你在 58 个数据集、19 个标准、18 个工具中智能匹配