全部数据集
数据集总数
本站已收录 40+ 个具身智能/机器人数据集,包括开源、闭源、可申请等类型。
目录
国际开源数据集
001. Open X-Embodiment
| 字段 | 内容 |
|---|---|
| 机构 | Google DeepMind |
| 规模 | 15 种机器人,100W+ 轨迹 |
| 机器人类型 | 多机型统一 |
| 任务 | 机器人操纵 |
| 数据模态 | 视觉、本体状态、动作 |
| 类型 | 🟢 开源 |
| 官方链接 | robotics-transformer-x.github.io |
| 论文 | RT-X: Open X-Embodiment |
备注
跨具身最大开源数据集,RT-X 训练必备。覆盖多种机器人形态,适合泛化学习研究。
002. BridgeData V2
| 字段 | 内容 |
|---|---|
| 机构 | UC Berkeley RAIL |
| 规模 | 85K 操纵轨迹 |
| 机器人类型 | 机械臂 |
| 任务 | 桌面操纵 |
| 数据模态 | 视觉、动作 |
| 类型 | 🟢 开源 |
| 官方链接 | rail-berkeley.github.io/bridgedata |
| 论文 | BridgeData V2 |
备注
小样本学习、模仿学习常用。数据质量高,任务多样。
003. RH20T
| 字段 | 内容 |
|---|---|
| 机构 | 斯坦福大学、Google |
| 规模 | 20K 视频,120+ 任务 |
| 机器人类型 | 机械臂 |
| 任务 | 日常 household 操纵 |
| 数据模态 | RGB、深度 |
| 类型 | 🟢 开源 |
| 官方链接 | rh20t.github.io |
| 论文 | RH20T |
备注
高质量居家机器人视频数据集,适合日常任务学习。
004. RoboSet (MobRob)
| 字段 | 内容 |
|---|---|
| 机构 | Carnegie Mellon University |
| 规模 | 220K 演示轨迹 |
| 机器人类型 | 机械臂 |
| 任务 | 桌面操纵、装配 |
| 数据模态 | 多视角视觉 |
| 类型 | 🟢 开源 |
| 官方链接 | roboset.github.io |
| 论文 | RoboSet |
备注
适合策略学习、扩散模型研究。多视角数据便于3D理解。
005. Libero
| 字段 | 内容 |
|---|---|
| 机构 | 斯坦福大学 |
| 规模 | 130+ 任务,240W+ 帧 |
| 机器人类型 | 机械臂 |
| 任务 | 长程多阶段任务 |
| 数据模态 | 视觉 |
| 类型 | 🟢 开源 |
| 官方链接 | libero-project.github.io |
| 论文 | Libero |
备注
长程任务 benchmark,适合指令跟随和任务规划研究。
006. MetaWorld
| 字段 | 内容 |
|---|---|
| 机构 | Meta AI、UC Berkeley |
| 规模 | 50+ 操纵任务 |
| 机器人类型 | 机械臂(仿真) |
| 任务 | 多任务强化学习 |
| 数据模态 | 仿真状态 |
| 类型 | 🟢 开源 |
| 官方链接 | meta-world.github.io |
| 论文 | MetaWorld |
备注
最常用强化学习基准之一,适合元学习和多任务学习。
007. RLBench
| 字段 | 内容 |
|---|---|
| 机构 | 牛津大学 |
| 规模 | 100+ 任务 |
| 机器人类型 | 机械臂(仿真) |
| 任务 | 操纵、装配 |
| 数据模态 | 视觉、深度、点云 |
| 类型 | 🟢 开源 |
| 官方链接 | sites.google.com/view/rlbench |
| 论文 | RLBench |
备注
任务多样,视觉信息丰富,适合模仿学习研究。
008. ManiSkill2
| 字段 | 内容 |
|---|---|
| 机构 | 斯坦福大学、清华大学 |
| 规模 | 仿真大规模操纵 |
| 机器人类型 | 机械臂 |
| 任务 | 操纵、手眼协调 |
| 数据模态 | 点云、视觉 |
| 类型 | 🟢 开源 |
| 官方链接 | maniskill2.github.io |
| 论文 | ManiSkill2 |
备注
基于 SAPIEN 的高质量仿真数据,支持点云输入。
009. RoboSuite
| 字段 | 内容 |
|---|---|
| 机构 | UC Berkeley |
| 规模 | 多个仿真环境 |
| 机器人类型 | 机械臂 |
| 任务 | 强化学习、操纵 |
| 数据模态 | 仿真状态、视觉 |
| 类型 | 🟢 开源 |
| 官方链接 | robosuite.ai |
| 论文 | RoboSuite |
备注
模块化仿真框架,适合算法开发和基准测试。
010. CALVIN
| 字段 | 内容 |
|---|---|
| 机构 | Bosch Center for AI、图宾根大学 |
| 规模 | 居家长期操纵 |
| 机器人类型 | 移动机械臂 |
| 任务 | 语言条件机器人 |
| 数据模态 | 视觉、语言 |
| 类型 | 🟢 开源 |
| 官方链接 | ut-ras.github.io/CALVIN |
| 论文 | CALVIN |
备注
语言条件 long-horizon 任务,适合指令理解和执行研究。
011. ARIO
| 字段 | 内容 |
|---|---|
| 机构 | Carnegie Mellon University |
| 规模 | 居家场景操纵数据集 |
| 机器人类型 | 机械臂 |
| 任务 | 日常操纵 |
| 数据模态 | 视觉 |
| 类型 | 🟢 开源 |
| 官方链接 | ario-dataset.github.io |
备注
大规模日常操纵数据,适合泛化策略学习。
012. OCRL
| 字段 | 内容 |
|---|---|
| 机构 | UC Berkeley |
| 规模 | 持续学习数据集 |
| 机器人类型 | 机械臂 |
| 任务 | 物体操纵、持续学习 |
| 数据模态 | 视觉 |
| 类型 | 🟢 开源 |
| 官方链接 | OCRL Dataset |
| 论文 | OCRL |
备注
持续学习 benchmark,适合灾难性遗忘研究。
013. RT-1 Data
| 字段 | 内容 |
|---|---|
| 机构 | Google DeepMind |
| 规模 | 130K 演示 |
| 机器人类型 | 移动机械臂 |
| 任务 | 居家日常任务 |
| 数据模态 | 视觉、本体状态、动作 |
| 类型 | 🟢 开源 |
| 官方链接 | robotics-transformer.github.io |
| 论文 | RT-1 |
备注
RT-1 训练数据,适合真实机器人策略学习。
014. RoboCat Data
| 字段 | 内容 |
|---|---|
| 机构 | Google DeepMind |
| 规模 | 多机器人操纵数据 |
| 机器人类型 | 机械臂 |
| 任务 | 跨任务操纵 |
| 数据模态 | 视觉、动作 |
| 类型 | 🟢 开源 |
| 官方链接 | deepmind.google/blog/robocat |
| 论文 | RoboCat |
备注
自我提升的机器人智能体数据,适合多任务学习。
015. T-Diffusion Data
| 字段 | 内容 |
|---|---|
| 机构 | Google DeepMind |
| 机器人类型 | 机械臂 |
| 任务 | 操纵策略扩散模型 |
| 数据模态 | 视觉、动作 |
| 类型 | 🟢 开源 |
| 官方链接 | deepmind.google/blog/t-diffusion |
| 论文 | T-Diffusion |
备注
扩散模型在机器人操纵中的应用,适合动作生成研究。
国内开源数据集
016. AgiBot World(智元机器人)
| 字段 | 内容 |
|---|---|
| 机构 | 智元机器人(AgiBot) |
| 规模 | 100W+ 轨迹,2976 小时 |
| 机器人类型 | 人形机器人 |
| 任务 | 家居、餐饮、办公、商超 |
| 数据模态 | 视觉、力控、本体状态 |
| 类型 | 🟢 开源 |
| 官方链接 | agibot-world.com |
| 论文 | AgiBot World |
备注
国内最大人形开源数据集,覆盖真实场景丰富,规模化程度高。
017. RoboMIND(北京人形机器人创新中心)
| 字段 | 内容 |
|---|---|
| 机构 | 北京人形机器人创新中心 |
| 规模 | 6W+ 分钟真机数据 |
| 机器人类型 | 人形机器人 |
| 任务 | 多任务操纵 |
| 数据模态 | 视觉、力控、本体状态 |
| 类型 | 🟢 开源 |
| 官方链接 | robomind.cn |
| 论文 | RoboMIND |
备注
国内统一人形数据协议基准,多构型机器人数据。
018. DAMO-SOLO
| 字段 | 内容 |
|---|---|
| 机构 | 阿里达摩院 |
| 机器人类型 | 机械臂 |
| 任务 | 操纵 |
| 数据模态 | 视觉 |
| 类型 | 🟢 开源 |
| 官方链接 | Alibaba DAMO |
备注
阿里达摩院机器人数据集,适合工业操纵研究。
019. GR-1 Dataset(傅利叶)
| 字段 | 内容 |
|---|---|
| 机构 | 傅利叶智能(Fourier Intelligence) |
| 规模 | 人形机器人数据集 |
| 机器人类型 | 人形机器人 |
| 任务 | 全身运动、操纵 |
| 数据模态 | 视觉、力控、本体 |
| 类型 | 🟢 开源 / 部分申请 |
| 官方链接 | fourier-intelligence.com |
备注
傅利叶 GR-1 人形机器人数据,适合双足运动和操纵研究。
020. H1 Dataset(宇树)
| 字段 | 内容 |
|---|---|
| 机构 | 宇树科技(Unitree) |
| 机器人类型 | 人形机器人 |
| 任务 | 全身运动 |
| 数据模态 | 本体状态 |
| 类型 | 🟢 开源 |
| 官方链接 | unitree.com |
备注
宇树 H1 人形机器人数据,适合运动控制研究。
021. 其他国内数据集
| 编号 | 名称 | 机构 | 状态 |
|---|---|---|---|
| - | 国产机械臂数据集 | 多家高校/企业 | 部分开源 |
| - | 国产移动机器人数据集 | 国内机器人公司 | 部分开源 |
仿真数据集
022. Isaac Sim Dataset
| 字段 | 内容 |
|---|---|
| 机构 | NVIDIA |
| 机器人类型 | 仿真 |
| 任务 | 通用操纵仿真 |
| 数据模态 | 视觉、点云、深度 |
| 类型 | 🟢 开源(部分) |
| 官方链接 | developer.nvidia.com/isaac-sim |
备注
NVIDIA 高保真仿真环境,适合 sim-to-real 研究。
023. Habitat
| 字段 | 内容 |
|---|---|
| 机构 | Meta AI (Facebook AI) |
| 机器人类型 | 仿真 |
| 任务 | 室内导航、具身交互 |
| 数据模态 | 视觉、深度 |
| 类型 | 🟢 开源 |
| 官方链接 | aihabitat.org |
| 论文 | Habitat |
备注
大规模室内导航 benchmark,支持 Gibson、Matterport3D 等场景。
024. iGibson
| 字段 | 内容 |
|---|---|
| 机构 | 斯坦福大学 |
| 机器人类型 | 仿真 |
| 任务 | 仿真家庭环境导航、操纵 |
| 数据模态 | 视觉、深度、物理 |
| 类型 | 🟢 开源 |
| 官方链接 | stanfordvl.github.io/igibson |
| 论文 | iGibson |
备注
交互式家庭仿真环境,支持物理交互。
025. SAPIEN
| 字段 | 内容 |
|---|---|
| 机构 | 斯坦福大学、上海交通大学 |
| 机器人类型 | 仿真 |
| 任务 | 操纵、仿真 |
| 数据模态 | 视觉、点云 |
| 类型 | 🟢 开源 |
| 官方链接 | sapien.ucsd.edu |
| 论文 | SAPIEN |
备注
PartNet-Mobility 物体模型,支持高质量部件级操纵。
026. FMTC (Foundation Model Benchmark)
| 字段 | 内容 |
|---|---|
| 机构 | Carnegie Mellon University |
| 机器人类型 | 仿真 |
| 任务 | 具身操纵仿真 |
| 数据模态 | 视觉 |
| 类型 | 🟢 开源 |
| 官方链接 | fmbench.github.io |
备注
基础模型 benchmark,适合评估 VLA 等模型。
027. CoppeliaSim (Webots 替代)
| 字段 | 内容 |
|---|---|
| 机构 | Coppelia Robotics |
| 机器人类型 | 仿真 |
| 任务 | 多场景机器人仿真 |
| 数据模态 | 视觉 |
| 类型 | 🟢 开源(教育版免费) |
| 官方链接 | coppeliarobotics.com |
备注
跨平台机器人仿真器,适合教育和研究。
触觉 / 电子皮肤数据集
028. TactileToolbox
| 字段 | 内容 |
|---|---|
| 机构 | 多个高校联合 |
| 机器人类型 | 触觉传感 |
| 任务 | 触觉感知 |
| 数据模态 | 触觉(GelSight、DIGIT等) |
| 类型 | 🟢 开源 |
| 官方链接 | tactile-toolbox.github.io |
备注
统一触觉数据格式工具箱,适合触觉学习研究。
029. DIGIT Dataset
| 字段 | 内容 |
|---|---|
| 机构 | MIT |
| 机器人类型 | 触觉传感 |
| 任务 | 触觉操纵 |
| 数据模态 | 高分辨率触觉图像 |
| 类型 | 🟢 开源 |
| 官方链接 | digit.ml |
| 论文 | DIGIT |
备注
DIGIT 触觉传感器数据集,适合视觉-触觉融合。
030. TacTip Datasets
| 字段 | 内容 |
|---|---|
| 机构 | 布里斯托大学 |
| 机器人类型 | 触觉传感 |
| 任务 | 触觉引导操纵 |
| 数据模态 | 触觉图像 |
| 类型 | 🟢 开源 |
| 官方链接 | tactile.fandom.com |
备注
TacTip GelTip 系列传感器数据,适合主动触觉研究。
031. SoftManip
| 字段 | 内容 |
|---|---|
| 机构 | 多个高校联合 |
| 机器人类型 | 柔性机械臂 |
| 任务 | 柔性物体操纵 |
| 数据模态 | 视觉、触觉 |
| 类型 | 🟢 开源 |
| 官方链接 | softmanipulation.com |
备注
软体机器人操纵数据,适合柔性物体处理研究。
闭源 / 可申请数据集
提示
以下数据集为闭源或需要合作申请。联系信息仅供参考,实际申请请访问官方渠道。
032. Tesla Optimus Data
| 字段 | 内容 |
|---|---|
| 机构 | 特斯拉(Tesla) |
| 机器人类型 | 人形机器人 |
| 任务 | 制造任务 |
| 类型 | 🔴 闭源 / 学术合作可申请 |
| 官方链接 | tesla.com/optimus |
备注
特斯拉 Optimus 人形机器人数据,实际使用需联系特斯拉。
033. Boston Dynamics Data
| 字段 | 内容 |
|---|---|
| 机构 | Boston Dynamics |
| 机器人类型 | 四足 / 人形 |
| 任务 | 运动、操纵 |
| 类型 | 🔴 闭源 / 合作 |
| 官方链接 | bostondynamics.com |
备注
波士顿动力机器人数据,商业合作可获取。
034. Unitree H1 内部数据
| 字段 | 内容 |
|---|---|
| 机构 | 宇树科技(Unitree) |
| 机器人类型 | 人形机器人 |
| 类型 | 🔴 闭源 / 合作 |
| 官方链接 | unitree.com/h1 |
备注
宇树 H1 人形机器人内部数据,合作可获取。
035. 优必选 Walker 数据集
| 字段 | 内容 |
|---|---|
| 机构 | 优必选(UBTech) |
| 机器人类型 | 人形机器人 |
| 任务 | 服务任务 |
| 类型 | 🔴 闭源 / 合作 |
| 官方链接 | ubtech.com |
备注
优必选 Walker 系列数据,商业合作可获取。
036. 小米 CyberOne 数据
| 字段 | 内容 |
|---|---|
| 机构 | 小米 |
| 机器人类型 | 人形机器人 |
| 任务 | 感知、交互 |
| 类型 | 🔴 闭源 |
| 官方链接 | xiaomi.com |
备注
小米 CyberOne 数据,实际使用需联系小米。
037. 云鲸导航数据
| 字段 | 内容 |
|---|---|
| 机构 | 云鲸智能 |
| 机器人类型 | 移动机器人 |
| 任务 | 室内导航 |
| 类型 | 🔴 闭源 |
| 官方链接 | 云鲸官网 |
备注
云鲸扫地机器人 SLAM 和导航数据。
038. 科沃斯 SLAM 数据
| 字段 | 内容 |
|---|---|
| 机构 | 科沃斯(Ecovacs) |
| 机器人类型 | 移动机器人 |
| 任务 | SLAM、导航 |
| 类型 | 🔴 闭源 |
| 官方链接 | ecovacs.com |
备注
科沃斯家庭服务机器人 SLAM 数据。
039. Google DeepMind Robotics 内部数据
| 字段 | 内容 |
|---|---|
| 机构 | Google DeepMind |
| 机器人类型 | 多类型 |
| 任务 | 多种任务 |
| 类型 | 🔴 闭源 |
| 官方链接 | deepmind.com/robotics |
备注
DeepMind 机器人研究数据,部分通过学术合作可获取。
040. Microsoft Embodied AI Data
| 字段 | 内容 |
|---|---|
| 机构 | Microsoft |
| 机器人类型 | 具身智能 |
| 任务 | 具身感知、交互 |
| 类型 | 🔴 闭源 / 学术合作 |
| 官方链接 | microsoft.com |
备注
微软具身智能研究数据,学术合作可获取部分。
041. NVIDIA Isaac 私有数据
| 字段 | 内容 |
|---|---|
| 机构 | NVIDIA |
| 机器人类型 | 仿真 |
| 任务 | 机器人仿真 |
| 类型 | 🔴 闭源 / 商业合作 |
| 官方链接 | nvidia.com/isaac |
备注
NVIDIA Isaac 仿真平台私有数据,商业合作可获取。
042. 华为具身智能数据
| 字段 | 内容 |
|---|---|
| 机构 | 华为 |
| 机器人类型 | 人形机器人 |
| 任务 | 多种任务 |
| 类型 | 🔴 闭源 / 合作 |
| 官方链接 | huawei.com |
备注
华为具身智能研究数据,合作可获取。
043. 百度机器人学习数据
| 字段 | 内容 |
|---|---|
| 机构 | 百度 |
| 机器人类型 | 机械臂、移动 |
| 任务 | 机器人学习 |
| 类型 | 🔴 闭源 |
| 官方链接 | baidu.com |
备注
百度机器人学习研究数据。
044. 腾讯 Robotics X 数据
| 字段 | 内容 |
|---|---|
| 机构 | 腾讯 |
| 机器人类型 | 多类型 |
| 任务 | 机器人研究 |
| 类型 | 🔴 闭源 |
| 官方链接 | tencent.com |
备注
腾讯 Robotics X 实验室数据。
045. 商汤绝影机器人数据
| 字段 | 内容 |
|---|---|
| 机构 | 商汤科技(SenseTime) |
| 机器人类型 | 人形/移动 |
| 任务 | 具身智能 |
| 类型 | 🔴 闭源 |
| 官方链接 | sensetime.com |
备注
商汤绝影具身智能数据。
数据集类型说明
| 标识 | 类型 | 说明 |
|---|---|---|
| 🟢 开源 | Open Source | 可自由下载使用 |
| 🟡 部分开源 | Partial Open | 部分数据开源,部分需申请 |
| 🔴 闭源 | Closed Source | 不公开,需合作申请 |
需要帮助?
- 想提交新数据集?→ 提交页面
- 需要更多数据集信息?→ 联系邮箱:submit@embodiedai-data.com