UniACT 数据集深度解析:高德如何用 600 万轨迹统一具身智能数据格式
2026 年 3 月 31 日,高德 AMAP CV Lab 随 ABot-M0 模型开源发布了 UniACT 数据集——一个整合 6 个主流开源数据集、覆盖 20+ 种机器人形态、总计 600 万+ 轨迹的超大规模具身智能数据资源。
UniACT 是什么
UniACT(Universal Action Dataset)并非从零采集的新数据集,而是一个「数据标准化层」。它将 OXE、OXE-AugE、AgiBot-Beta、RoboCoin、RoboMind、Galaxea 这 6 个异构数据集统一处理,输出一份格式一致的训练语料。
核心挑战在于:不同数据集的动作空间、传感器配置、机器人形态差异巨大。Open X-Embodiment 使用绝对末端位姿,AgiBot-Beta 使用关节角度,Galaxea 则是双臂协同——把它们塞进同一个训练 batch,需要一套统一表示。
技术核心:统一动作表示
UniACT 的解决方案是:
- 动作统一:全部转换为末端执行器增量动作(delta pose)+ 旋转向量(rotation vector),消除绝对位姿和关节空间的差异
- 双臂填充:单臂数据集自动填充为双臂格式,缺失臂的动作置零,确保模型输入维度一致
- 标准化管线:官方 GitHub 仓库提供完整的数据构建脚本,一行命令即可复现
这套设计的直接受益者是 VLA(视觉-语言-动作)模型。ABot-M0 在 UniACT 上预训练后,在多个操作基准上展现了强大的泛化能力。
规模与覆盖
- 600 万+ 轨迹,9500+ 小时数据
- 20+ 机器人形态:从单臂 WidowX 到双臂人形机器人
- 6 个源数据集:涵盖抓取、操作、长序列任务等多种场景
- Apache 2.0 许可:可商用
避坑提示
注意区分高德 UniACT 和 清华 UniAct(2025)——前者是 AMAP CV Lab 发布的数据集,后者是清华/商汤提出的通用动作框架。名字几乎一样,但完全是两回事。
获取方式
UniACT 不提供一键下载包——你需要 clone 官方仓库,下载 6 个源数据集,然后运行标准化脚本自行构建。仓库中也提供了 ABot-M0 的预训练权重,可直接用于推理或微调。
GitHub:github.com/amap-cvlab/ABot-Manipulation
项目主页:amap-cvlab.github.io/ABot-Manipulation
免责声明:以上信息均来自网络公开资料(GitHub、arXiv、项目主页),仅做信息汇总与技术分析,不构成任何商业建议。数据集版权归原机构/作者所有。如有不准确之处,欢迎通过评论区指正。