AGIBOT WORLD 2026
智元机器人(AGIBOT)
AGIBOT WORLD 2026 是智元机器人(AGIBOT)于 2026 年 4 月正式开源的大规模具身智能数据集,定位为首个覆盖具身智能全域研究的开源数据底座,分五阶段持续发布。
硬件平台:基于自研 精灵 G2(Sprite G2) 通用人形机器人,集成高性能关节执行器、多模态传感器(多视角 RGB-D、触觉、LiDAR、IMU、力传感器)和高性能域控制器。
采集方式:100% 真实场景 + 真人遥操作。采用超视距第一人称遥操作 + 全身控制(WBC),操作员以机器人视角实时操控,手臂、腰部、手部协同运作。引入力控采集,记录接触动力学和力反馈。
场景覆盖:家居、酒店餐饮、商业空间、安防、工业物流等复杂真实环境,含遮挡、逆光、动态人流等真实干扰。
两阶段发布:
- 第一期(2026.04):模仿学习数据,数百小时真实世界数据,含任务描述、动作序列、原子技能标签、物体标注,保留错误恢复轨迹
- 第二期(2026.06.03):行业首个聚焦物理交互的开源具身数据集,面向世界模型和神经仿真器。主动保留抓取失败、物体滑落、碰撞、液体飞溅、布料变形等「失败」数据,实验证实加入失败数据后世界模型的物理一致性显著提升
配套生态:Genie Sim 3.0 仿真器 + GE-Sim 2.0 世界模型 + GO-2 基座模型 + 1:1 数字孪生仿真数据同步开源。
下载:https://huggingface.co/datasets/agibot-world/AgiBotWorld2026
项目主页:https://agibot-world.com
机构
智元机器人(AGIBOT)
规模
数百小时真机数据(五阶段持续发布),100+ 场景,精灵 G2 人形机器人平台
许可证
Apache 2.0(完全开源,可商用)
机器人类型
人形机器人
任务类型
操作 抓取 家居 交互
发布年份
2024
数据模态
RGB、深度、触觉、LiDAR、力控、本体状态、动作、IMU
🤖 真机遥操作采集(全身控制 + 力控)✅ 自动 + 人工核验(DaaS 工业质检管线)💻 真机实测(100% 真实场景)📊 有数据划分
VLA 框架兼容性
🧠 GR00T N1
数据格式
存储格式HDF5 + LeRobot 格式(Hugging Face 托管)
数据规模数百小时,五阶段持续发布
压缩方式标准压缩
文件布局原始 HDF5(按 episode 分文件)+ LeRobot 转换版
索引方式原始 HDF5 attribute + 外部 Metadata.json;LeRobot 版含 meta/info.json
格式版本HDF5 v2.0 + LeRobot Parquet v3.0
episode
step
observation(RGB-D/触觉/LiDAR/IMU/力/关节状态)
action
快速上手
加载数据
# AgiBot 原始数据
import h5py
with h5py.File('agibot_episode.hdf5', 'r') as f:
joints = f['action/robot'][:]
# LeRobot 转换版
from lerobot.datasets import LeRobotDataset
dataset = LeRobotDataset('agibot-world')依赖库
预处理说明
原始 HDF5 + LeRobot 双格式;G2 平台采集
数据内容
传感器规格
RGB
深度
触觉
LiDAR
IMU
力传感器
本体状态
动作
数据统计
场景数家居、酒店餐饮、商业空间、安防、工业物流等 100+ 真实场景
物体数日常物品、工具、容器等,含 2D 边界框标注
任务数自由形式遥操作任务(模仿学习 + 多样交互),含失败恢复轨迹
轨迹/片段数数百小时真机数据(五阶段持续发布)
标注信息
更新历史
2024-12
首次发布,100万+轨迹、2976小时数据
2026
2026年更新版发布,新增触觉和LiDAR模态