HANDAL

开源

NVIDIA

HANDAL（Household ANnotated Dataset for functionAL grasping）是 NVIDIA 于 IROS 2023 发布的可供性分割基准数据集。

规模：30.8 万 标注帧、2.2K 视频序列、212 个真实世界物体，覆盖 17 个类别（工具箱类：锤子、钳子、螺丝刀、扳手等；厨房类：铲子、量杯、滤网等）。

标注内容：类别级 6-DoF 位姿 + 尺度、像素级物体分割、像素级 3D handle affordance 分割、2D 边界框、3D 物体网格重建。

测试拆分：HANDAL-Mini / HANDAL Easy / HANDAL Hard 三个测试集，分别测试模型在不同难度下的可供性分割能力。

协议：CC BY-NC-SA 4.0。

AFUN 论文在 HANDAL 三个测试集上全面超越所有基线（+23.9 gIoU）。

机构

NVIDIA

规模

308K 标注帧 + 2.2K 视频，212 个真实物体 + 17 类别

许可证

CC BY-NC-SA 4.0

机器人类型

通用

任务类型

可供性分割抓取

发布年份

2023

数据模态

RGB、深度、语义分割、3D重建

🤖 人工采集（真实桌面场景）✅ 人工标注🏠 100%真机📊 有数据划分

数据格式

存储格式PNG + JSON + NPY

数据规模~50GB（含 3D 网格）

压缩方式无

文件布局按 scene 分目录；每 scene 含 PNG 图像 + JSON 标注

索引方式scene 目录索引 + object_id 列表

格式版本PNG（RGB）+ JSON（标注）+ NPY（位姿）

scene

object_category

frame

RGB

depth

affordance_mask

6D_pose

mesh

快速上手

加载数据

import json, cv2
# HANDAL 数据格式：PNG + JSON 标注
img = cv2.imread('handal_frame.png')
with open('handal_annotation.json') as f:
    ann = json.load(f)
# ann 含 affordance_mask, 6d_pose, bbox

依赖库

opencv-pythonnumpyjson

预处理说明

PNG 图像 + JSON 标注；308K 帧；17 类别

数据内容

传感器规格

RGB

深度

语义分割

6-DoF位姿

数据统计

场景数桌面/工作台，含遮挡与多角度视角

物体数212 个真实物体（17 类别：锤子、钳子、螺丝刀、铲子、滤网等）

任务数functional grasping（功能性抓取：识别并抓取物体的正确操作部位）

轨迹/片段数2.2K 视频序列（308K 帧）

标注信息

可供性分割掩码6-DoF 类别位姿2D 边界框3D 网格重建像素级物体分割