Galaxea Open-World Dataset (GOD)
星海图 (Galaxea)
Galaxea Open-World Dataset(GOD)是由星海图(Galaxea)于 2025 年 8 月发布的具身智能真机数据集。
数据采集:全部数据来自自研 R1 Lite 移动双手机器人(23 自由度),统一硬件采集确保动作空间与感知输入一致。
数据规模:500 小时真实操作数据(>10TB),10 万+ 轨迹,覆盖 150 类任务、50 种真实场景(住宅 50.8%、餐饮 33.2%、零售 8.7%、办公 7.4%)、1,600+ 独特物体及 58 项操作技能。
数据质量:非实验室环境采集,含动态光照、遮挡与干扰,提供子任务级自然语言注释,支持分层机器人学习。标准化 RLDS/LeRobot 格式,含完整元数据;另提供小样本集便于快速测试。
配套开源 G0 双系统 VLA 模型(VLM 多模态规划 + VLA 细粒度执行),已支持 NVIDIA EgoScale、蚂蚁 Lingbot-VLA 等外部研究项目。
机构
星海图 (Galaxea)
规模
500 小时,10万+ 轨迹
许可证
Apache 2.0
机器人类型
移动机器人
任务类型
操作 抓取 导航 家居
发布年份
2025
数据模态
视觉、动作、语言
🤖 遥操作采集✅ 细粒度人工标注💻 100%真机(非实验室开放场景)📊 有数据划分
数据格式
存储格式RLDS / LeRobot
数据规模10TB+
压缩方式原始 + 压缩
文件布局LeRobot v3 格式(meta/info.json + data/*.parquet + videos/*.mp4)
索引方式meta/info.json(全局)+ meta/episodes/*.parquet(逐 episode)
格式版本LeRobot Parquet v3.0 + MP4/H.264
episode
step
observation (RGB + depth + proprioception)
action (23-DoF)
language_instruction
快速上手
加载数据
from lerobot.datasets import LeRobotDataset
dataset = LeRobotDataset('galaxea-open-world')
# 或从 HuggingFace 直接加载
from datasets import load_dataset
ds = load_dataset('OpenGalaxea/Galaxea-Open-World-Dataset')依赖库
预处理说明
100K+ 轨迹;多视角 RGB-D;LeRobot v3 格式
数据内容
传感器规格
RGB-D 相机
关节编码器
IMU
腕部力传感器
数据统计
场景数50 种真实场景(住宅/餐饮/零售/办公)
物体数1600+ 种
任务数150 类操作任务
轨迹/片段数100,000+
标注信息
引用信息
@article{galaxea2025,
title={Galaxea Open-World Dataset and G0 Dual-System VLA Model},
author={Galaxea Team},
journal={arXiv preprint arXiv:2509.00576},
year={2025}
}更新历史
2025-08-31
首次发布,500 小时真实操作数据,10 万+ 轨迹,配套 G0 模型
2025-10
下载量突破 40 万次,成为全球关注度最高的具身智能数据集之一