← 返回全部数据集

Galaxea Open-World Dataset (GOD)

开源

星海图 (Galaxea)

Galaxea Open-World Dataset(GOD)是由星海图(Galaxea)于 2025 年 8 月发布的具身智能真机数据集。

数据采集:全部数据来自自研 R1 Lite 移动双手机器人(23 自由度),统一硬件采集确保动作空间与感知输入一致。

数据规模500 小时真实操作数据(>10TB),10 万+ 轨迹,覆盖 150 类任务、50 种真实场景(住宅 50.8%、餐饮 33.2%、零售 8.7%、办公 7.4%)、1,600+ 独特物体及 58 项操作技能。

数据质量:非实验室环境采集,含动态光照、遮挡与干扰,提供子任务级自然语言注释,支持分层机器人学习。标准化 RLDS/LeRobot 格式,含完整元数据;另提供小样本集便于快速测试。

配套开源 G0 双系统 VLA 模型(VLM 多模态规划 + VLA 细粒度执行),已支持 NVIDIA EgoScale、蚂蚁 Lingbot-VLA 等外部研究项目。

机构
星海图 (Galaxea)
规模
500 小时,10万+ 轨迹
许可证
Apache 2.0
机器人类型
移动机器人
任务类型
操作 抓取 导航 家居
发布年份
2025
数据模态
视觉、动作、语言
🤖 遥操作采集✅ 细粒度人工标注💻 100%真机(非实验室开放场景)📊 有数据划分

数据格式

存储格式RLDS / LeRobot
数据规模10TB+
压缩方式原始 + 压缩
文件布局LeRobot v3 格式(meta/info.json + data/*.parquet + videos/*.mp4)
索引方式meta/info.json(全局)+ meta/episodes/*.parquet(逐 episode)
格式版本LeRobot Parquet v3.0 + MP4/H.264
episode
step
observation (RGB + depth + proprioception)
action (23-DoF)
language_instruction

快速上手

加载数据

from lerobot.datasets import LeRobotDataset
dataset = LeRobotDataset('galaxea-open-world')
# 或从 HuggingFace 直接加载
from datasets import load_dataset
ds = load_dataset('OpenGalaxea/Galaxea-Open-World-Dataset')

依赖库

lerobottorchdatasets

预处理说明

100K+ 轨迹;多视角 RGB-D;LeRobot v3 格式

数据内容

传感器规格

RGB-D 相机
关节编码器
IMU
腕部力传感器

数据统计

场景数50 种真实场景(住宅/餐饮/零售/办公)
物体数1600+ 种
任务数150 类操作任务
轨迹/片段数100,000+

标注信息

子任务级自然语言指令动作序列场景标签物体类别

相关链接

引用信息

@article{galaxea2025,
  title={Galaxea Open-World Dataset and G0 Dual-System VLA Model},
  author={Galaxea Team},
  journal={arXiv preprint arXiv:2509.00576},
  year={2025}
}

更新历史

2025-08-31
首次发布,500 小时真实操作数据,10 万+ 轨迹,配套 G0 模型
2025-10
下载量突破 40 万次,成为全球关注度最高的具身智能数据集之一

采用的数据标准

相关数据集

讨论

AI 助手
输入需求,AI 帮你在 58 个数据集、19 个标准、18 个工具中智能匹配