UniACT 数据集深度解析：高德如何用 600 万轨迹统一具身智能数据格式

2026-06-02 作者 EmbodiedAI Datasets

数据集解析VLA数据标准动作表示

2026 年 3 月 31 日，高德 AMAP CV Lab 随 ABot-M0 模型开源发布了 UniACT 数据集——一个整合 6 个主流开源数据集、覆盖 20+ 种机器人形态、总计 600 万+ 轨迹的超大规模具身智能数据资源。

UniACT 是什么

UniACT（Universal Action Dataset）并非从零采集的新数据集，而是一个「数据标准化层」。它将 OXE、OXE-AugE、AgiBot-Beta、RoboCoin、RoboMind、Galaxea 这 6 个异构数据集统一处理，输出一份格式一致的训练语料。

核心挑战在于：不同数据集的动作空间、传感器配置、机器人形态差异巨大。Open X-Embodiment 使用绝对末端位姿，AgiBot-Beta 使用关节角度，Galaxea 则是双臂协同——把它们塞进同一个训练 batch，需要一套统一表示。

UniACT 的解决方案是：

这套设计的直接受益者是 VLA（视觉-语言-动作）模型。ABot-M0 在 UniACT 上预训练后，在多个操作基准上展现了强大的泛化能力。

注意区分高德 UniACT 和 清华 UniAct（2025）——前者是 AMAP CV Lab 发布的数据集，后者是清华/商汤提出的通用动作框架。名字几乎一样，但完全是两回事。

UniACT 不提供一键下载包——你需要 clone 官方仓库，下载 6 个源数据集，然后运行标准化脚本自行构建。仓库中也提供了 ABot-M0 的预训练权重，可直接用于推理或微调。

免责声明：以上信息均来自网络公开资料（GitHub、arXiv、项目主页），仅做信息汇总与技术分析，不构成任何商业建议。数据集版权归原机构/作者所有。如有不准确之处，欢迎通过评论区指正。