← 返回全部数据集

InstructPart

开源

CMU Robotics Institute

InstructPart 是 CMU 机器人研究所于 ACL 2025 (Main) 提出的任务导向部件分割基准。

规模2,400 张真实世界图像,覆盖 48 个物体类别、44 个部件类别、30 个可供性类别、37 个动作类别。

标注9,600 条人工标注任务指令(含专家标注 + GPT-polished + 人工核验),像素级分割掩码。

两大任务
1. TRPS(Task Reasoning Part Segmentation)——给定任务指令+图像,推理并分割出正确操作部件(如 '拉开微波炉需要碰哪个部位?')
2. ORPS(Oracle Referring Part Segmentation)——给定直接部件/物体指代,分割对应部件(如 '水龙头的把手')

协议:CC BY 4.0。

AFUN 在 InstructPart 上与 ReasonAFF 一起作为核心可供性分割评测基准。

机构
CMU Robotics Institute
规模
2,400 真实图像 + 48 物体类别 + 9,600 任务指令
许可证
CC BY 4.0
机器人类型
通用
任务类型
可供性分割 语义分割 语言推理
发布年份
2025
数据模态
RGB、语义分割、语言
🤖 人工采集(真实场景)✅ 人工标注 + GPT 辅助 + 人工核验🏠 100%真机📊 有数据划分

数据格式

存储格式PNG + JSON(任务指令)
数据规模~1GB
压缩方式
文件布局按 image 分文件;每图配 JSON 任务指令 + 分割标注
索引方式task_instruction + part_category JSON 索引
格式版本PNG(RGB)+ JSON(任务指令 + 分割标注)
image
task_instruction
part_segmentation_mask
affordance_label
object_category

快速上手

加载数据

import json, cv2
img = cv2.imread('instructpart_sample.jpg')
with open('instructpart_label.json') as f:
    label = json.load(f)
# label 含 task_instruction, part_segmentation_mask, affordance_label

依赖库

opencv-pythonnumpyjson

预处理说明

9,600 任务指令;TRPS + ORPS 双任务

数据内容

传感器规格

RGB

数据统计

场景数日常家庭场景
物体数48 类日常物体(微波炉、水龙头、垃圾桶、剪刀等)
任务数TRPS(任务推理部件分割)+ ORPS(指代部件分割)
轨迹/片段数2,400 图像 + 9,600 任务指令

标注信息

部件分割掩码任务指令可供性标签物体/部件类别

相关链接

相关数据集

讨论

AI 助手
输入需求,AI 帮你在 58 个数据集、19 个标准、18 个工具中智能匹配