返回列表 发布新帖

目前具身数据集建设方面主要有哪些问题,对应的解决思路是怎样的?

460 0
发表于 2024-10-17 16:05:38 | 查看全部 阅读模式
国地中心在建设人形机器人数据集过程中,遇到了各种各样的问题,有些已被解决,有些仍未很好地解决。总结分享如下,供大家学习讨论:

问题1:数据采集效率低、成本高。虽然仿真合成数据虽然可以补充真实数据的不足,但因其基于模拟生成,与真实世界数据存在差异,因此高质量的数据仍通过实物样机采集,由人驱动机器人完成全流程任务。一套采集设备通常需要1~2人操作,以15秒的作业数据为例,一套设备连续运行一天仅能采集300~500条作业数据,对于具身大模型而言,数据生产效率过于低下、成本较高。为提升数据采集效率、降低数据成本,一方面需要打造集成化的数据作业平台,将任务管理、动作设定、数据采集、数据处理、数据上传存储等流程自动化,以工程化手段提升数采效率;另一方面,需要大幅降低硬件成本,包括遥操作设备、人形机器人设备等。

问题2:数据无法满足跨平台复用需求。目前人形机器人具身数据采集方法,主要聚焦在关节层数据,由于不同机器人的关节结构有差异,采集的相关数据不能跨平台复用,使得数据成本无法通过规模化应用实现大幅下降。解决这一问题有两种思路:一是脱离关节结构依赖,直接采集人体运动数据或机器人末端数据,后期通过绑定人形机器人模型与逆运动解算实现不同构型机器人的通用。二是从模型架构出发,研发高效、通用的具身模型来处理不同类型的数据,并实现在不同的机器人上的迁移和应用。

问题3:缺乏统一的数据标准规范。由于具身智能属新兴领域,行业内尚未形成统一的数据标准规范,使得市场上的开源数据无法快速应用到已有具身模型上,阻碍了数据共享与流通。为解决这一问题,需尽快制定具身数据的行业标准,规范数据格式与存储方式、数据质量评估办法等,聚集市场合力共同构建大规模通用具身数据集。


回复

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Copyright © 2025 OPENLOONG. All Rights Reserved. Powered by Discuz!
  • 关注B站
  • 关注抖音
  • 关注微信公众号
Copyright © 2025 开发者论坛 - OpenLoong 版权所有 All Rights Reserved.
关灯 在本版发帖 返回顶部
快速回复 返回顶部 返回列表