RLDS

数据格式

Google DeepMind

RLDS（Reinforcement Learning Datasets Standard）是 Google DeepMind 提出的标准化机器人学习数据格式，基于 TFDS 体系构建。

将数据统一组织为 episode → step → observation/action/reward 层次结构，支持高效的随机访问与流式加载。

是 Open X-Embodiment 的底层格式基础，已被 60+ 数据集采用，成为具身智能领域事实上的数据格式标准。

📋 规范性要求

Schema 结构

🔴 必须

数据必须以 episode 为最外层组织单元

每个 episode 是 tf.data.Dataset of Steps，对应一次完整的任务执行轨迹

🔴 必须

每个 step 必须包含 is_first 和 is_last 两个布尔字段

is_first 标识 episode 的第一步（含初始状态），is_last 标识最后一步

🔴 必须

同一数据集内所有 step 必须包含相同的字段集合

字段集合不能因 episode 而异，必须全局一致

🟡 建议

建议包含 observation、action、reward、discount、is_terminal 字段

is_terminal 标识自然终止（区别于时间截断），discount 为浮点折扣因子

存储格式

🔴 必须

基于 TFDS（TensorFlow Datasets）体系存储

支持流式读取、分片、确定性 shuffle，通过 tf.data.Dataset API 访问

🟢 可选

可选使用分片（shard）存储以支持大规模数据集

TFDS 原生支持按文件分片，无需额外处理

元数据

🟡 建议

建议提供 episode 级元数据

如任务是否成功、语言指令、场景描述等，便于下游筛选和分析

发布组织

Google DeepMind

标准类型

数据格式

开放程度

● 完全开源

许可证

Apache 2.0

适用场景

真机仿真

数据模态

RGB、Proprioception、Action