← 返回数据标准
Reinforcement Learning Datasets Standard

RLDS

数据格式

Google DeepMind

RLDS(Reinforcement Learning Datasets Standard)是 Google DeepMind 提出的标准化机器人学习数据格式,基于 TFDS 体系构建。

将数据统一组织为 episode → step → observation/action/reward 层次结构,支持高效的随机访问与流式加载。

是 Open X-Embodiment 的底层格式基础,已被 60+ 数据集采用,成为具身智能领域事实上的数据格式标准。

📋 规范性要求

Schema 结构
🔴 必须
数据必须以 episode 为最外层组织单元
每个 episode 是 tf.data.Dataset of Steps,对应一次完整的任务执行轨迹
🔴 必须
每个 step 必须包含 is_first 和 is_last 两个布尔字段
is_first 标识 episode 的第一步(含初始状态),is_last 标识最后一步
🔴 必须
同一数据集内所有 step 必须包含相同的字段集合
字段集合不能因 episode 而异,必须全局一致
🟡 建议
建议包含 observation、action、reward、discount、is_terminal 字段
is_terminal 标识自然终止(区别于时间截断),discount 为浮点折扣因子
存储格式
🔴 必须
基于 TFDS(TensorFlow Datasets)体系存储
支持流式读取、分片、确定性 shuffle,通过 tf.data.Dataset API 访问
🟢 可选
可选使用分片(shard)存储以支持大规模数据集
TFDS 原生支持按文件分片,无需额外处理
元数据
🟡 建议
建议提供 episode 级元数据
如任务是否成功、语言指令、场景描述等,便于下游筛选和分析
发布组织
Google DeepMind
标准类型
数据格式
开放程度
● 完全开源
许可证
Apache 2.0
适用场景
真机 仿真
数据模态
RGB、Proprioception、Action

相关链接

关联数据集

讨论

AI 助手
输入需求,AI 帮你在 58 个数据集、19 个标准、18 个工具中智能匹配