← 返回博客

UniACT 数据集深度解析:高德如何用 600 万轨迹统一具身智能数据格式

2026-06-02 作者 EmbodiedAI Datasets
数据集解析VLA数据标准动作表示

2026 年 3 月 31 日,高德 AMAP CV Lab 随 ABot-M0 模型开源发布了 UniACT 数据集——一个整合 6 个主流开源数据集、覆盖 20+ 种机器人形态、总计 600 万+ 轨迹的超大规模具身智能数据资源。

UniACT 是什么

UniACT(Universal Action Dataset)并非从零采集的新数据集,而是一个「数据标准化层」。它将 OXE、OXE-AugE、AgiBot-Beta、RoboCoin、RoboMind、Galaxea 这 6 个异构数据集统一处理,输出一份格式一致的训练语料。

核心挑战在于:不同数据集的动作空间、传感器配置、机器人形态差异巨大。Open X-Embodiment 使用绝对末端位姿,AgiBot-Beta 使用关节角度,Galaxea 则是双臂协同——把它们塞进同一个训练 batch,需要一套统一表示。

技术核心:统一动作表示

UniACT 的解决方案是:

  • 动作统一:全部转换为末端执行器增量动作(delta pose)+ 旋转向量(rotation vector),消除绝对位姿和关节空间的差异
  • 双臂填充:单臂数据集自动填充为双臂格式,缺失臂的动作置零,确保模型输入维度一致
  • 标准化管线:官方 GitHub 仓库提供完整的数据构建脚本,一行命令即可复现

这套设计的直接受益者是 VLA(视觉-语言-动作)模型。ABot-M0 在 UniACT 上预训练后,在多个操作基准上展现了强大的泛化能力。

规模与覆盖

  • 600 万+ 轨迹,9500+ 小时数据
  • 20+ 机器人形态:从单臂 WidowX 到双臂人形机器人
  • 6 个源数据集:涵盖抓取、操作、长序列任务等多种场景
  • Apache 2.0 许可:可商用

避坑提示

注意区分高德 UniACT清华 UniAct(2025)——前者是 AMAP CV Lab 发布的数据集,后者是清华/商汤提出的通用动作框架。名字几乎一样,但完全是两回事。

获取方式

UniACT 不提供一键下载包——你需要 clone 官方仓库,下载 6 个源数据集,然后运行标准化脚本自行构建。仓库中也提供了 ABot-M0 的预训练权重,可直接用于推理或微调。

GitHub:github.com/amap-cvlab/ABot-Manipulation

项目主页:amap-cvlab.github.io/ABot-Manipulation

论文:arxiv.org/abs/2602.11236


免责声明:以上信息均来自网络公开资料(GitHub、arXiv、项目主页),仅做信息汇总与技术分析,不构成任何商业建议。数据集版权归原机构/作者所有。如有不准确之处,欢迎通过评论区指正。

AI 助手
输入需求,AI 帮你在 58 个数据集、19 个标准、18 个工具中智能匹配