DexGraspVLA 数据集
Psi-Robot / 北京大学
DexGraspVLA 数据集是 Psi-Robot 与北京大学于 2025 年提出的灵巧手抓取 VLA 框架的配套数据集。包含:DexGraspVLA 人类演示 51 条真实遥操作轨迹(~7.3 GB);DexGraspNet 3.0(DexVLG/ICCV 2025)1.7 亿仿真抓取姿态覆盖 174,000 物体含部件级语义标注;DexGrasp Anything(CVPR 2025)340 万+ 抓取姿态 15,000+ 物体。分层架构(VLM 高层规划 + Diffusion 低层控制),杂乱场景 90%+ 成功率,支持透明/异形物体。协议:CC BY 4.0。
机构
Psi-Robot / 北京大学
规模
7.3 GB 人类遥操作 + DexGraspNet 3.0(1.7 亿抓取姿态 / 17.4 万物体)
许可证
CC BY 4.0
机器人类型
灵巧手 仿真
任务类型
抓取 操作
发布年份
2025
数据模态
RGB、深度、本体状态、视觉
🤖 人工遥操作 + 仿真生成✅ 自动标注(仿真)+ 人工标注(遥操作)💻 100%真机(遥操作)📊 有数据划分
VLA 框架兼容性
🧠 OpenVLA
数据格式
存储格式HDF5 / NPY + PNG
数据规模~7.3 GB(遥操作)+ TB 级(仿真)
压缩方式无
文件布局HDF5 + DexGraspNet 3.0 NPY 文件
索引方式HDF5 内部 attribute + DexGraspNet 3.0 物体 ID 索引
格式版本HDF5 v2.0 + NPY(仿真抓取姿态)
episode -> step -> observation(RGB-D + proprioception)
action(dexterous_hand_joints)
language_prompt
快速上手
加载数据
import h5py
with h5py.File('dexgraspvla_demo.hdf5', 'r') as f:
actions = f['data/demo_0/actions'][:]
obs = f['data/demo_0/obs'][:]依赖库
预处理说明
51 条遥操作 + DexGraspNet 3.0(1.7 亿姿态)
数据内容
传感器规格
RGB-D
本体状态(灵巧手关节)
数据统计
场景数杂乱桌面场景(含透明/异形物体)
物体数174,000+ 物体(Objaverse),含透明、异形、日常物品
任务数灵巧手抓取(杂乱物体、透明物体、长指令、非抓握操作)
轨迹/片段数51 遥操作 + 1.7 亿仿真姿态