← 返回全部数据集

CMU Stretch

开源

Carnegie Mellon University

CMU Stretch 是由 Carnegie Mellon University 发布的视觉可供性机器人操作数据集。

该数据集基于 VRB (Vision-Robotics Bridge) 框架,从人类视频中学习视觉可供性(affordance),然后将这些知识迁移到机器人策略中。使用 Hello Robot Stretch 机器人在 10+ 真实家居任务中验证,仅需少量演示即可实现跨任务泛化。

属于 Open X-Embodiment 成员数据集。

机构
Carnegie Mellon University
规模
VRB 视觉可供性,从人类视频迁移技能到机器人
许可证
MIT
机器人类型
移动机器人
任务类型
操作 家居
发布年份
2023
数据模态
视觉、动作
🤖 人工遥操作采集✅ 部分人工标注🏠 100%真机📊 无数据划分

VLA 框架兼容性

🧠 π0🧠 OpenVLA🧠 Octo🧠 RT-2🧠 RDT-1B

数据格式

存储格式RLDS / TFDS
数据规模~10GB
压缩方式gzip
文件布局RLDS 格式,RGB + 动作 + 可供性标注
索引方式TFDS 内置索引
格式版本TFDS/RLDS
episode
step
observation
action
affordance

数据内容

传感器规格

RGB 相机

数据统计

场景数家庭室内
物体数门、抽屉、把手、日常物品
任务数开关门/抽屉、抓取把手、物品取放
轨迹/片段数~500

标注信息

可供性标注动作序列

相关链接

引用信息

@article{bahl2023vrb,
  title={Affordances from Human Videos as a Versatile Representation for Robotics},
  author={Bahl, Shikhar and Mendonca, Russell and Chen, Lili and Jain, Unnat and Pathak, Deepak},
  journal={arXiv preprint arXiv:2304.08488},
  year={2023}
}

采用的数据标准

相关数据集

讨论

AI 助手
输入需求,AI 帮你在 58 个数据集、19 个标准、18 个工具中智能匹配