DexGraspVLA 数据集

开源

Psi-Robot / 北京大学

DexGraspVLA 数据集是 Psi-Robot 与北京大学于 2025 年提出的灵巧手抓取 VLA 框架的配套数据集。包含：DexGraspVLA 人类演示 51 条真实遥操作轨迹（~7.3 GB）；DexGraspNet 3.0（DexVLG/ICCV 2025）1.7 亿仿真抓取姿态覆盖 174,000 物体含部件级语义标注；DexGrasp Anything（CVPR 2025）340 万+ 抓取姿态 15,000+ 物体。分层架构（VLM 高层规划 + Diffusion 低层控制），杂乱场景 90%+ 成功率，支持透明/异形物体。协议：CC BY 4.0。

机构

Psi-Robot / 北京大学

规模

7.3 GB 人类遥操作 + DexGraspNet 3.0（1.7 亿抓取姿态 / 17.4 万物体）

许可证

CC BY 4.0

机器人类型

灵巧手仿真

任务类型

抓取操作

发布年份

2025

数据模态

RGB、深度、本体状态、视觉

🤖 人工遥操作 + 仿真生成✅ 自动标注（仿真）+ 人工标注（遥操作）💻 100%真机（遥操作）📊 有数据划分

VLA 框架兼容性

🧠 OpenVLA

数据格式

存储格式HDF5 / NPY + PNG

数据规模~7.3 GB（遥操作）+ TB 级（仿真）

压缩方式无

文件布局HDF5 + DexGraspNet 3.0 NPY 文件

索引方式HDF5 内部 attribute + DexGraspNet 3.0 物体 ID 索引

格式版本HDF5 v2.0 + NPY（仿真抓取姿态）

episode -> step -> observation（RGB-D + proprioception）

action（dexterous_hand_joints）

language_prompt

快速上手

加载数据

import h5py
with h5py.File('dexgraspvla_demo.hdf5', 'r') as f:
    actions = f['data/demo_0/actions'][:]
    obs = f['data/demo_0/obs'][:]

依赖库

h5pynumpy

预处理说明

51 条遥操作 + DexGraspNet 3.0（1.7 亿姿态）

数据内容

传感器规格

RGB-D

本体状态（灵巧手关节）

数据统计

场景数杂乱桌面场景（含透明/异形物体）

物体数174,000+ 物体（Objaverse），含透明、异形、日常物品

任务数灵巧手抓取（杂乱物体、透明物体、长指令、非抓握操作）

轨迹/片段数51 遥操作 + 1.7 亿仿真姿态

标注信息

语言任务指令抓取姿态物体类别部件语义