← 返回全部数据集

AGIBOT WORLD 2026

开源

智元机器人(AGIBOT)

AGIBOT WORLD 2026 是智元机器人(AGIBOT)于 2026 年 4 月正式开源的大规模具身智能数据集,定位为首个覆盖具身智能全域研究的开源数据底座,分五阶段持续发布。

硬件平台:基于自研 精灵 G2(Sprite G2) 通用人形机器人,集成高性能关节执行器、多模态传感器(多视角 RGB-D、触觉、LiDAR、IMU、力传感器)和高性能域控制器。

采集方式:100% 真实场景 + 真人遥操作。采用超视距第一人称遥操作 + 全身控制(WBC),操作员以机器人视角实时操控,手臂、腰部、手部协同运作。引入力控采集,记录接触动力学和力反馈。

场景覆盖:家居、酒店餐饮、商业空间、安防、工业物流等复杂真实环境,含遮挡、逆光、动态人流等真实干扰。

两阶段发布
- 第一期(2026.04):模仿学习数据,数百小时真实世界数据,含任务描述、动作序列、原子技能标签、物体标注,保留错误恢复轨迹
- 第二期(2026.06.03):行业首个聚焦物理交互的开源具身数据集,面向世界模型和神经仿真器。主动保留抓取失败、物体滑落、碰撞、液体飞溅、布料变形等「失败」数据,实验证实加入失败数据后世界模型的物理一致性显著提升

配套生态:Genie Sim 3.0 仿真器 + GE-Sim 2.0 世界模型 + GO-2 基座模型 + 1:1 数字孪生仿真数据同步开源。

下载https://huggingface.co/datasets/agibot-world/AgiBotWorld2026
项目主页:https://agibot-world.com

机构
智元机器人(AGIBOT)
规模
数百小时真机数据(五阶段持续发布),100+ 场景,精灵 G2 人形机器人平台
许可证
Apache 2.0(完全开源,可商用)
机器人类型
人形机器人
任务类型
操作 抓取 家居 交互
发布年份
2024
数据模态
RGB、深度、触觉、LiDAR、力控、本体状态、动作、IMU
🤖 真机遥操作采集(全身控制 + 力控)✅ 自动 + 人工核验(DaaS 工业质检管线)💻 真机实测(100% 真实场景)📊 有数据划分

VLA 框架兼容性

🧠 GR00T N1

数据格式

存储格式HDF5 + LeRobot 格式(Hugging Face 托管)
数据规模数百小时,五阶段持续发布
压缩方式标准压缩
文件布局原始 HDF5(按 episode 分文件)+ LeRobot 转换版
索引方式原始 HDF5 attribute + 外部 Metadata.json;LeRobot 版含 meta/info.json
格式版本HDF5 v2.0 + LeRobot Parquet v3.0
episode
step
observation(RGB-D/触觉/LiDAR/IMU/力/关节状态)
action

快速上手

加载数据

# AgiBot 原始数据
import h5py
with h5py.File('agibot_episode.hdf5', 'r') as f:
    joints = f['action/robot'][:]
# LeRobot 转换版
from lerobot.datasets import LeRobotDataset
dataset = LeRobotDataset('agibot-world')

依赖库

h5pylerobottorch

预处理说明

原始 HDF5 + LeRobot 双格式;G2 平台采集

数据内容

传感器规格

RGB
深度
触觉
LiDAR
IMU
力传感器
本体状态
动作

数据统计

场景数家居、酒店餐饮、商业空间、安防、工业物流等 100+ 真实场景
物体数日常物品、工具、容器等,含 2D 边界框标注
任务数自由形式遥操作任务(模仿学习 + 多样交互),含失败恢复轨迹
轨迹/片段数数百小时真机数据(五阶段持续发布)

标注信息

任务级描述原子技能标签2D 物体边界框物体名称/颜色语言指令

相关链接

更新历史

2024-12
首次发布,100万+轨迹、2976小时数据
2026
2026年更新版发布,新增触觉和LiDAR模态

采用的数据标准

相关数据集

讨论

AI 助手
输入需求,AI 帮你在 58 个数据集、19 个标准、18 个工具中智能匹配