← 返回全部数据集

HANDAL

开源

NVIDIA

HANDAL(Household ANnotated Dataset for functionAL grasping)是 NVIDIA 于 IROS 2023 发布的可供性分割基准数据集。

规模30.8 万 标注帧、2.2K 视频序列、212 个真实世界物体,覆盖 17 个类别(工具箱类:锤子、钳子、螺丝刀、扳手等;厨房类:铲子、量杯、滤网等)。

标注内容:类别级 6-DoF 位姿 + 尺度、像素级物体分割、像素级 3D handle affordance 分割、2D 边界框、3D 物体网格重建。

测试拆分:HANDAL-Mini / HANDAL Easy / HANDAL Hard 三个测试集,分别测试模型在不同难度下的可供性分割能力。

协议:CC BY-NC-SA 4.0。

AFUN 论文在 HANDAL 三个测试集上全面超越所有基线(+23.9 gIoU)。

机构
NVIDIA
规模
308K 标注帧 + 2.2K 视频,212 个真实物体 + 17 类别
许可证
CC BY-NC-SA 4.0
机器人类型
通用
任务类型
可供性分割 抓取
发布年份
2023
数据模态
RGB、深度、语义分割、3D重建
🤖 人工采集(真实桌面场景)✅ 人工标注🏠 100%真机📊 有数据划分

数据格式

存储格式PNG + JSON + NPY
数据规模~50GB(含 3D 网格)
压缩方式
文件布局按 scene 分目录;每 scene 含 PNG 图像 + JSON 标注
索引方式scene 目录索引 + object_id 列表
格式版本PNG(RGB)+ JSON(标注)+ NPY(位姿)
scene
object_category
frame
RGB
depth
affordance_mask
6D_pose
mesh

快速上手

加载数据

import json, cv2
# HANDAL 数据格式:PNG + JSON 标注
img = cv2.imread('handal_frame.png')
with open('handal_annotation.json') as f:
    ann = json.load(f)
# ann 含 affordance_mask, 6d_pose, bbox

依赖库

opencv-pythonnumpyjson

预处理说明

PNG 图像 + JSON 标注;308K 帧;17 类别

数据内容

传感器规格

RGB
深度
语义分割
6-DoF位姿

数据统计

场景数桌面/工作台,含遮挡与多角度视角
物体数212 个真实物体(17 类别:锤子、钳子、螺丝刀、铲子、滤网等)
任务数functional grasping(功能性抓取:识别并抓取物体的正确操作部位)
轨迹/片段数2.2K 视频序列(308K 帧)

标注信息

可供性分割掩码6-DoF 类别位姿2D 边界框3D 网格重建像素级物体分割

相关链接

相关数据集

讨论

AI 助手
输入需求,AI 帮你在 58 个数据集、19 个标准、18 个工具中智能匹配