← 返回全部数据集

ARIO

开源

Carnegie Mellon University

ARIO 是 All Robots In One 大规模多具身机器人数据集。

整合了多种机器人形态的操作数据,提供标准化数据格式和联合训练管线,适用于跨具身基础模型预训练。

机构
Carnegie Mellon University
规模
居家场景操纵数据集
许可证
开源(详见官方链接)
机器人类型
机械臂
任务类型
操作 家居
发布年份
2024
数据模态
视觉
🤖 遥操作采集✅ 人工标注🏠 100%真机📊 有数据划分

数据格式

存储格式详见官方链接
数据规模居家场景操纵数据集
压缩方式未知
文件布局RLDS 分片格式;多具身统一 episode-step 层级
索引方式TFDS 内置索引;episode metadata 含具身类型
格式版本TFDS/RLDS
episode
step
observation
action(multi-embodiment unified format, RLDS)

快速上手

加载数据

import tensorflow_datasets as tfds
ds = tfds.load('ario', split='train')
for episode in ds.take(1):
    for step in episode['steps']:
        img = step['observation']['image']
        action = step['action']

依赖库

tensorflow-datasetstensorflownumpy

预处理说明

RLDS 多具身统一格式;动作维度因具身而异

数据内容

传感器规格

视觉

数据统计

场景数详见官方链接
物体数详见官方链接
任务数2 种任务类型
轨迹/片段数居家场景操纵数据集

相关链接

采用的数据标准

相关数据集

讨论

AI 助手
输入需求,AI 帮你在 58 个数据集、19 个标准、18 个工具中智能匹配