BC-Z
Google / Everyday Robots / UC Berkeley / Stanford
BC-Z(BC-Zero)是 Google Robotics、Everyday Robots、UC Berkeley 和 Stanford 于 2022 年联合发布的大规模机器人模仿学习数据集。
规模:39,350 条训练轨迹 + 3,914 条验证轨迹,覆盖 100 种 桌面操作任务(抓取、开抽屉、摆物件、倒水等),累计 125 小时机器人操作数据。
采集方式:7 名操作员通过 DAgger(Dataset Aggregation)方式远程操控 12 台 Franka Panda 机械臂,交替执行自主策略和遥操作干预。
数据格式:TFDS(TensorFlow Datasets),每条轨迹包含:RGB 图像观测 (171×213)、末端执行器 3D 位置残差 + 轴角旋转残差 + 夹爪开合、自然语言任务指令 + 512 维 Universal Sentence Encoder 嵌入。
核心特性:零样本任务泛化——通过语言描述或人类操作视频即可执行训练中未见过的任务。是 OpenVLA、RT-1 等 VLA 模型的核心预训练子集。
协议:CC BY 4.0。
机构
Google / Everyday Robots / UC Berkeley / Stanford
规模
39,350 训练轨迹 + 3,914 验证轨迹,100 种操作任务,81 GB (TFDS)
许可证
CC BY 4.0
机器人类型
机械臂
任务类型
操作 抓取
发布年份
2022
数据模态
RGB、语言、本体状态
🤖 人工遥操作采集(DAgger)✅ 人工标注(自然语言任务指令)🏠 100%真机📊 有数据划分
VLA 框架兼容性
🧠 π0🧠 OpenVLA🧠 Octo🧠 RT-2🧠 RDT-1B
数据格式
存储格式TFDS (RLDS 兼容)
数据规模81 GB (TFDS 格式) / 32 GB (ZIP 压缩)
压缩方式ZIP
文件布局TFDS 格式;流式加载;每条 episode 含 steps + language_instruction
索引方式TFDS 内置索引;natural_language_instruction 为可查询文本字段
格式版本TFDS/RLDS
episode
step
observation(RGB + language_embedding)
action(delta_pose + gripper)
快速上手
加载数据
import tensorflow_datasets as tfds
ds = tfds.load('bc_z', split='train')
for episode in ds.take(1):
for step in episode['steps']:
img = step['observation']['image']
action = step['action']
lang = step['observation']['natural_language_instruction']依赖库
预处理说明
TFDS 格式;100 任务;172×213 图像;语言指令
数据内容
传感器规格
RGB
本体状态(末端位姿、夹爪开合)
数据统计
场景数桌面操作场景(12 台 Franka Panda 工作台)
物体数多样化桌面物体(杯子、抽屉、布料、工具等)
任务数100 种桌面操作任务(抓取、开抽屉、摆物件、倒水、擦拭等)
轨迹/片段数39,350 训练 + 3,914 验证