← 返回全部数据集

BC-Z

开源

Google / Everyday Robots / UC Berkeley / Stanford

BC-Z(BC-Zero)是 Google Robotics、Everyday Robots、UC Berkeley 和 Stanford 于 2022 年联合发布的大规模机器人模仿学习数据集。

规模39,350 条训练轨迹 + 3,914 条验证轨迹,覆盖 100 种 桌面操作任务(抓取、开抽屉、摆物件、倒水等),累计 125 小时机器人操作数据。

采集方式:7 名操作员通过 DAgger(Dataset Aggregation)方式远程操控 12 台 Franka Panda 机械臂,交替执行自主策略和遥操作干预。

数据格式:TFDS(TensorFlow Datasets),每条轨迹包含:RGB 图像观测 (171×213)、末端执行器 3D 位置残差 + 轴角旋转残差 + 夹爪开合、自然语言任务指令 + 512 维 Universal Sentence Encoder 嵌入。

核心特性:零样本任务泛化——通过语言描述或人类操作视频即可执行训练中未见过的任务。是 OpenVLA、RT-1 等 VLA 模型的核心预训练子集。

协议:CC BY 4.0。

机构
Google / Everyday Robots / UC Berkeley / Stanford
规模
39,350 训练轨迹 + 3,914 验证轨迹,100 种操作任务,81 GB (TFDS)
许可证
CC BY 4.0
机器人类型
机械臂
任务类型
操作 抓取
发布年份
2022
数据模态
RGB、语言、本体状态
🤖 人工遥操作采集(DAgger)✅ 人工标注(自然语言任务指令)🏠 100%真机📊 有数据划分

VLA 框架兼容性

🧠 π0🧠 OpenVLA🧠 Octo🧠 RT-2🧠 RDT-1B

数据格式

存储格式TFDS (RLDS 兼容)
数据规模81 GB (TFDS 格式) / 32 GB (ZIP 压缩)
压缩方式ZIP
文件布局TFDS 格式;流式加载;每条 episode 含 steps + language_instruction
索引方式TFDS 内置索引;natural_language_instruction 为可查询文本字段
格式版本TFDS/RLDS
episode
step
observation(RGB + language_embedding)
action(delta_pose + gripper)

快速上手

加载数据

import tensorflow_datasets as tfds
ds = tfds.load('bc_z', split='train')
for episode in ds.take(1):
    for step in episode['steps']:
        img = step['observation']['image']
        action = step['action']
        lang = step['observation']['natural_language_instruction']

依赖库

tensorflow-datasetstensorflownumpy

预处理说明

TFDS 格式;100 任务;172×213 图像;语言指令

数据内容

传感器规格

RGB
本体状态(末端位姿、夹爪开合)

数据统计

场景数桌面操作场景(12 台 Franka Panda 工作台)
物体数多样化桌面物体(杯子、抽屉、布料、工具等)
任务数100 种桌面操作任务(抓取、开抽屉、摆物件、倒水、擦拭等)
轨迹/片段数39,350 训练 + 3,914 验证

标注信息

自然语言任务指令Universal Sentence Encoder 嵌入DAgger 自主/遥操标签

相关链接

采用的数据标准

相关数据集

讨论

AI 助手
输入需求,AI 帮你在 58 个数据集、19 个标准、18 个工具中智能匹配