HANDAL
NVIDIA
HANDAL(Household ANnotated Dataset for functionAL grasping)是 NVIDIA 于 IROS 2023 发布的可供性分割基准数据集。
规模:30.8 万 标注帧、2.2K 视频序列、212 个真实世界物体,覆盖 17 个类别(工具箱类:锤子、钳子、螺丝刀、扳手等;厨房类:铲子、量杯、滤网等)。
标注内容:类别级 6-DoF 位姿 + 尺度、像素级物体分割、像素级 3D handle affordance 分割、2D 边界框、3D 物体网格重建。
测试拆分:HANDAL-Mini / HANDAL Easy / HANDAL Hard 三个测试集,分别测试模型在不同难度下的可供性分割能力。
协议:CC BY-NC-SA 4.0。
AFUN 论文在 HANDAL 三个测试集上全面超越所有基线(+23.9 gIoU)。
机构
NVIDIA
规模
308K 标注帧 + 2.2K 视频,212 个真实物体 + 17 类别
许可证
CC BY-NC-SA 4.0
机器人类型
通用
任务类型
可供性分割 抓取
发布年份
2023
数据模态
RGB、深度、语义分割、3D重建
🤖 人工采集(真实桌面场景)✅ 人工标注🏠 100%真机📊 有数据划分
数据格式
存储格式PNG + JSON + NPY
数据规模~50GB(含 3D 网格)
压缩方式无
文件布局按 scene 分目录;每 scene 含 PNG 图像 + JSON 标注
索引方式scene 目录索引 + object_id 列表
格式版本PNG(RGB)+ JSON(标注)+ NPY(位姿)
scene
object_category
frame
RGB
depth
affordance_mask
6D_pose
mesh
快速上手
加载数据
import json, cv2
# HANDAL 数据格式:PNG + JSON 标注
img = cv2.imread('handal_frame.png')
with open('handal_annotation.json') as f:
ann = json.load(f)
# ann 含 affordance_mask, 6d_pose, bbox依赖库
预处理说明
PNG 图像 + JSON 标注;308K 帧;17 类别
数据内容
传感器规格
RGB
深度
语义分割
6-DoF位姿
数据统计
场景数桌面/工作台,含遮挡与多角度视角
物体数212 个真实物体(17 类别:锤子、钳子、螺丝刀、铲子、滤网等)
任务数functional grasping(功能性抓取:识别并抓取物体的正确操作部位)
轨迹/片段数2.2K 视频序列(308K 帧)