RH20T
斯坦福大学、Google
RH20T 是由斯坦福大学和 Google 联合发布的高质量居家机器人视频数据集,包含 20,000 个 RGB-D 视频片段,覆盖 120+ 个日常任务。
数据集在真实家庭环境中采集,涵盖清洁、整理、烹饪等多种日常场景。每段视频配有动作轨迹标注,适用于机器人模仿学习和视频预测研究。
机构
斯坦福大学、Google
规模
20K 视频,120+ 任务
许可证
CC BY 4.0
机器人类型
机械臂
任务类型
操作 家居
发布年份
2023
数据模态
RGB、深度
🤖 遥操作采集✅ 人工标注🏠 100%真机📊 有数据划分
VLA 框架兼容性
🧠 RDT-1B
数据格式
存储格式HDF5 / MP4
数据规模500GB+
压缩方式H.264
文件布局按视频分文件;每视频含 HDF5(关节数据)+ MP4(RGB)
索引方式视频 timestamp 索引 + HDF5 内部属性
格式版本HDF5 v2.0 + MP4/H.264
video
frame
RGB+Depth+action
快速上手
加载数据
import h5py
with h5py.File('rh20t_sample.hdf5', 'r') as f:
rgb = f['video'][:]
depth = f['depth'][:]
action = f['action'][:]依赖库
预处理说明
视频-based 格式;每帧含 RGB+Depth+action;T 维在第一个轴
数据内容
传感器规格
RGB-D 相机
关节编码器
数据统计
场景数真实家庭环境
物体数日常家居物品
任务数120+
轨迹/片段数20,000
标注信息
引用信息
@article{fang2023rh20t,
title={RH20T: A Robotic Dataset for Learning Diverse Skills in One Day},
author={Fang, Hao-Shu and others},
journal={arXiv preprint arXiv:2307.11795},
year={2023}
}