CMU Stretch

开源

Carnegie Mellon University

CMU Stretch 是由 Carnegie Mellon University 发布的视觉可供性机器人操作数据集。

该数据集基于 VRB (Vision-Robotics Bridge) 框架，从人类视频中学习视觉可供性（affordance），然后将这些知识迁移到机器人策略中。使用 Hello Robot Stretch 机器人在 10+ 真实家居任务中验证，仅需少量演示即可实现跨任务泛化。

属于 Open X-Embodiment 成员数据集。

机构

Carnegie Mellon University

规模

VRB 视觉可供性，从人类视频迁移技能到机器人

许可证

MIT

机器人类型

移动机器人

任务类型

操作家居

发布年份

2023

数据模态

视觉、动作

🤖 人工遥操作采集✅ 部分人工标注🏠 100%真机📊 无数据划分

VLA 框架兼容性

🧠 π0🧠 OpenVLA🧠 Octo🧠 RT-2🧠 RDT-1B

数据格式

存储格式RLDS / TFDS

数据规模~10GB

压缩方式gzip

文件布局RLDS 格式，RGB + 动作 + 可供性标注

索引方式TFDS 内置索引

格式版本TFDS/RLDS

episode

step

observation

action

affordance

数据内容

传感器规格

RGB 相机

数据统计

场景数家庭室内

物体数门、抽屉、把手、日常物品

任务数开关门/抽屉、抓取把手、物品取放

轨迹/片段数~500

标注信息

可供性标注动作序列

引用信息

@article{bahl2023vrb,
  title={Affordances from Human Videos as a Versatile Representation for Robotics},
  author={Bahl, Shikhar and Mendonca, Russell and Chen, Lili and Jain, Unnat and Pathak, Deepak},
  journal={arXiv preprint arXiv:2304.08488},
  year={2023}
}