CMU Stretch
Carnegie Mellon University
CMU Stretch 是由 Carnegie Mellon University 发布的视觉可供性机器人操作数据集。
该数据集基于 VRB (Vision-Robotics Bridge) 框架,从人类视频中学习视觉可供性(affordance),然后将这些知识迁移到机器人策略中。使用 Hello Robot Stretch 机器人在 10+ 真实家居任务中验证,仅需少量演示即可实现跨任务泛化。
属于 Open X-Embodiment 成员数据集。
机构
Carnegie Mellon University
规模
VRB 视觉可供性,从人类视频迁移技能到机器人
许可证
MIT
机器人类型
移动机器人
任务类型
操作 家居
发布年份
2023
数据模态
视觉、动作
🤖 人工遥操作采集✅ 部分人工标注🏠 100%真机📊 无数据划分
VLA 框架兼容性
🧠 π0🧠 OpenVLA🧠 Octo🧠 RT-2🧠 RDT-1B
数据格式
存储格式RLDS / TFDS
数据规模~10GB
压缩方式gzip
文件布局RLDS 格式,RGB + 动作 + 可供性标注
索引方式TFDS 内置索引
格式版本TFDS/RLDS
episode
step
observation
action
affordance
数据内容
传感器规格
RGB 相机
数据统计
场景数家庭室内
物体数门、抽屉、把手、日常物品
任务数开关门/抽屉、抓取把手、物品取放
轨迹/片段数~500
标注信息
引用信息
@article{bahl2023vrb,
title={Affordances from Human Videos as a Versatile Representation for Robotics},
author={Bahl, Shikhar and Mendonca, Russell and Chen, Lili and Jain, Unnat and Pathak, Deepak},
journal={arXiv preprint arXiv:2304.08488},
year={2023}
}