最小感知:实现资源受限机器人的自主性
自主移动机器人能力的快速提升有望在未来十年内让它们无处不在。这些机器人将继续提高灾害管理、环境监测、桥梁检查和农业检查等新应用领域的效率和安全性。为了在无人持续干预的情况下自主运行,即使在偏远或危险区域,机器人也必须仅使用机载传感和计算来感知、处理和解释环境数据。感知算法的进步使这种能力成为可能,使这些机器人能够主要依靠其感知能力来完成导航任务。然而,由于尺寸、面积、重量和功率限制,微型机器人的自主性主要受到传感器、内存和计算的阻碍。这些机器人的瓶颈在于资源受限的机器人的实时感知。为了使体长小于 100 毫米的机器人能够自主运行,我们从昆虫和蜂鸟等微小生物中汲取灵感,尽管它们的传感器和神经系统很小,但它们以复杂的感知、导航和生存能力而闻名。这项工作旨在为从更高的认知水平到更低的传感器水平的微型自主机器人设计一个紧凑而高效的最小感知框架提供见解。
1 简介
大自然花费了 38 亿年的时间进行基因进化的研究和开发。一代又一代,生物根据其日常活动、栖息地和周围环境不断进化。这种自然进化是有目的的(或简约的),而不是通用的,主要由针对特定需求和条件量身定制的感知行为驱动。可以说,进化的道路是节俭的。几千年来,这些系统在解决特定任务方面已经变得非常高效。这种简约的系统或生物为开发下一代机器人提供了蓝图。简约的本质在于利用最少的信息或传感模式来有效地实现目标。相比之下,机器人和人工智能 (AI) 领域仅发展了 50 年,其中大部分时间都花在开发独立和通用模块上。受大自然的启发,可以构建仅依靠机载传感和计算的机器人自主框架,探索以前从未想过的机器人规模的新可能性。机器人自主化的道路位于人工智能、计算机视觉、机器人技术和传感技术的交叉点上,从而催生出在资源有限的环境中表现出色的手掌大小的微型节俭机器人。 在资源受限的环境中实现机器人自主是一项复杂而具有挑战性的任务,需要复杂的策略才能实现最佳功能。核心概念涉及创建能够以有限的计算能力、能源可用性或传感器功能独立执行任务的机器人系统。这在空中机器人、深海探索或太空任务等资源管理至关重要的环境中尤为重要。强化学习或遗传算法等算法可以动态优化资源使用。这些算法的任务是平衡资源消耗和任务执行质量,以提高效率。此外,传感器融合对于补偿有限的传感器功能至关重要,它可以结合来自各种来源的数据来提高理解力和准确性。软件和硬件都经过精心设计,以利用特定的硬件特性来提高资源利用率。此外,资源受限机器人的自主性涉及规划、学习、感知和决策的全面整合,确保在具有挑战性的条件下有效运行。 从感知角度来看,资源受限环境中的机器人自主性带来了独特的挑战,需要创造性的解决方案。机器人的感知系统可能包括摄像头、激光雷达、声纳和其他传感器,充当机器人的“眼睛”。然而,在资源受限的环境中,这些传感器的功能可能会受到限制。为了克服这个问题,传感器融合等技术必不可少。传感器融合集成了来自各种传感器类型的数据,以增强对环境的整体理解并减少感知不确定性。此外,深度学习和计算机视觉方法用于从传感数据中识别相关特征并识别对象和模式。然而,由于计算资源受限,这些技术需要高效执行。能源考虑也至关重要,因为持续的数据收集和处理会消耗大量电力。低功耗模式和选择性感知(仅处理相关数据)等策略至关重要。因此,在资源受限的机器人自主性中,感知系统必须仔细平衡环境理解的深度和细节、计算需求和能源效率,以保持可靠的功能。图 1展示了采用我们框架的微型机器人。它展示了无法携带现有传统传感器和计算机的微型机器人。
尽管计算密集型感知算法可以通过网络卸载到云计算机或配套计算机,但这提出了一个基本问题:“我们为什么需要机载自主?”。依赖于附近无线连接的配套计算机或云计算的自主系统在野外部署中面临挑战。此类系统在 GPS 被拒的环境中容易受到攻击,并且经常受到延迟问题的影响。机载机器人自主性增强了系统安全性,降低了黑客攻击和其他安全威胁的脆弱性,并提高了稳健性。虽然有功能强大的自主机器人,具有大量机载计算能力,并且相对较大(超过 300 毫米),可用于空中和地面应用,但另一个问题出现了:“我们为什么需要小型机器人?”小型机器人安全灵活,可以成群部署,使其具有高度可扩展性和生产成本效益。此外,这些自主群允许机器人导航和检查时间敏感的密闭或危险区域,例如热核电站。众所周知,机器人自主性受到内存速度和大小、传感器类型和质量以及所需功率等因素的显著影响。这些因素直接影响机器人的尺寸、面积和重量。 尽管在尺寸、面积、重量、功率、计算和传感器能力方面存在显著差异,但蜜蜂和鸟类等生物可以执行类似的任务。然而,它们的感知和计算能力会因身体结构和环境的不同而有所不同。仿生学或生物启发工程学通过研究动物、鸟类、昆虫和植物等自然系统,为设计和制造机器人提供了重要的见解。例如,蜻蜓的视觉处理能力可以检测到运动并以惊人的精度测量深度,这启发了机器人机器视觉算法的发展。同样,蝙蝠的声纳系统对于在完全黑暗的环境中导航和狩猎至关重要,它为设计强大的基于回声的传感机制提供了蓝图,这对在低能见度条件下工作的机器人尤其有益。鸟类善于根据风的变化调整飞行动态,为开发空中无人机的自适应感知和控制系统提供了宝贵的见解。啮齿动物胡须的触觉敏感性也为设计在黑暗或杂乱环境中导航的机器人的触觉感知系统提供了指导。此外,群体机器人经常从蚂蚁和蜜蜂的沟通和协调策略中获取线索,使它们能够感知环境并高效、集体地执行复杂任务。因此,仿生学中的感知研究侧重于解释和利用自然界复杂的感官系统来提高机器人的感知和交互能力。
因此,自然灵感是开发具有机载自主能力的下一代微型机器人的蓝图。关键是要大幅缩小当前的自主系统,同时保持或增强其能力。参见图 2,该图说明了各种生物相对于其身体长度的感知能力。重要的是要认识到,一般来说,感知能力会随着身体尺寸的增大而增加,这意味着较大的生物具有更成熟的感知系统。然而,也有明显的例外,比如跳蛛、乌贼和某些种类的青蛙。例如,跳蛛拥有低分辨率的视觉系统,可以有效地处理快速移动的物体,使它们能够迅速做出反应并捕获猎物。同时,乌贼和一些青蛙通过改变孔径的形状进化了它们的视觉系统,例如乌贼的“W”形孔径和一些青蛙的垂直或水平开口。此外,图 2中的蓝色和绿色气泡代表现实世界中具有机载自主能力的微型机器人。此前,小至 120 毫米的机器人可以执行导航、避障和穿越形状不明的缝隙等任务(Jagannatha Sanket,2021 年),如蓝色气泡所示。这项工作取得了进展,甚至更小的机器人(小到信用卡大小(长度不到 3 英寸))也能实现增强的自主性,如绿色气泡所示。
为了实现这些机器人的可扩展性、可持续性和可分布性,必须制造能够执行简约任务的小型手掌大小的机器人。在这项工作中,我们引入了一个最小感知框架,这是手掌大小机器人自主性的核心。这种简单性指导复杂性的原则也应该启发我们对机器人技术的方法——我们的目标是从简单的设计中发展出复杂的功能,专注于效率而不是过度。对这个想法产生深远影响的因素之一来自诺姆·乔姆斯基的语言学极简主义纲领。乔姆斯基是一位杰出的语言学家、认知科学家和哲学家,他引入了这个纲领作为对句法理论的根本性重新评估,表明自然,包括人类语言,都尽可能直接和高效地运作。乔姆斯基理论的核心是句子是通过二元合并从一组基本词汇项构建而成的。这通过始终使用相同的操作来构造句子,最大限度地降低了计算复杂性。这允许从有限数量的元素中产生无限多样的表达。极简主义计划的另一个关键方面是“经济”原则,该原则假定语言表达遵循使用最少必要资源的原则,体现了“少即是多”的极简主义信条。 我们引入了一个最小感知框架(见图3),该框架从大自然中汲取灵感,解决了从高级认知到低级感官各个层面的节俭或极简主义问题。这是资源受限机器人自主框架的核心。这项工作的目的是向机器人社区介绍最小感知的方法。为了在本文的范围内实现它,我们必须依赖以前和当前研究的大量结果以及新概念。具体来说,我们利用 Ajna(Sanket 等人,2023 年)、TinyDepth(Singh,2023 年)、CodedVO(Shah 等人,2024b 年)和 AMI-EV(He 等人,2024 年)的结果来展示感知-行动问题的分类。该分类法构成了最小感知框架。
(截取论文开头部分内容,完整内容和机翻文件附件可下载)
004 最小感知:实现资源受限机器人的自主性.zip 提取码:gawv
|