robomimic / robosuite 生态
HDF5 机器人数据格式
Stanford / AI2
HDF5 Robomimic 是 Stanford / AI2 提出的基于 HDF5 的机器人操作数据格式,专为模仿学习设计。
将 demonstration 组织为 state/action/reward/done 四元组,支持多种观测模态(RGB、深度、点云、本体状态)。
是 robomimic 框架的默认格式,BridgeData V2、RoboTurk 等数据集均采用此格式。
📋 规范性要求
Schema 结构
🔴 必须
每个 HDF5 文件根节点必须为 data group
所有 demonstration 数据组织在 /data 下
🔴 必须
每个 demonstration 必须包含 states、actions、rewards、dones 四个 dataset
均按时间维度 [T, ...] 排列,T 为轨迹长度
🔴 必须
观测必须放在 obs/ group 下
常见观测键:robot0_eef_pos、robot0_eef_quat、robot0_gripper_qpos、agentview_image 等
🟡 建议
建议提供 mask/ group 定义 train/valid 划分
包含 train 和 valid 两个 dataset,列出各自包含的 demo 名称
🟢 可选
可选包含 next_obs/ group 存储下一时刻观测
非必要场景可通过 --exclude-next-obs 省略,节省约 5 倍存储
元数据
🔴 必须
每个 demo 必须有 num_samples 属性
记录该 demonstration 的时间步数
🔴 必须
根节点必须有 total 属性和 env_args 属性
total 为全数据集样本总数,env_args 为 JSON 格式的环境配置
存储格式
🟡 建议
建议使用 HDF5 压缩以减小存储体积
通过 hdf5plugin 使用 Blosc 等压缩插件
发布组织
Stanford / AI2
标准类型
数据格式
开放程度
● 完全开源
许可证
MIT
适用场景
仿真
数据模态
RGB、Depth、Proprioception、Action