ARIO
Carnegie Mellon University
ARIO 是 All Robots In One 大规模多具身机器人数据集。
整合了多种机器人形态的操作数据,提供标准化数据格式和联合训练管线,适用于跨具身基础模型预训练。
机构
Carnegie Mellon University
规模
居家场景操纵数据集
许可证
开源(详见官方链接)
机器人类型
机械臂
任务类型
操作 家居
发布年份
2024
数据模态
视觉
🤖 遥操作采集✅ 人工标注🏠 100%真机📊 有数据划分
数据格式
存储格式详见官方链接
数据规模居家场景操纵数据集
压缩方式未知
文件布局RLDS 分片格式;多具身统一 episode-step 层级
索引方式TFDS 内置索引;episode metadata 含具身类型
格式版本TFDS/RLDS
episode
step
observation
action(multi-embodiment unified format, RLDS)
快速上手
加载数据
import tensorflow_datasets as tfds
ds = tfds.load('ario', split='train')
for episode in ds.take(1):
for step in episode['steps']:
img = step['observation']['image']
action = step['action']依赖库
预处理说明
RLDS 多具身统一格式;动作维度因具身而异
数据内容
传感器规格
视觉
数据统计
场景数详见官方链接
物体数详见官方链接
任务数2 种任务类型
轨迹/片段数居家场景操纵数据集