"); //-->
来源丨https://zhuanlan.zhihu.com/p/545249730编辑丨极市平台 导读
本文提出无需微调的小样本目标检测方法AirDet,针对机器人自主探索任务设计。基训练后,未经微调的AirDet表现甚至优于部分微调后的方法。论文、项目代码、ROS部署接口均已开源。
AirDet项目网站:https://jaraxxus-me.github.io/ECCV2022_AirDet/
开源论文:https://arxiv.org/pdf/2112.01740.pdf
开源代码:https://github.com/Jaraxxus-Me/AirDet
ROS部署:https://github.com/Jaraxxus-Me/AirDet_ROS
引言小样本目标检测(FSOD)是近年兴起的一项计算机视觉任务,其基本设定是,仅提供少量(通常少于等于10个)新类样本情况下,方法即需检测基训练集之外类别的目标。
由于其在自主探索中的重要作用,FSOD受到了机器人界越来越多的关注。这是因为我们通常期望机器人在未知环境中检测到(模型训练过程中未见过的)新物体,然而在线探索的过程中,用户只能在线标注提供少量的新类样本。譬如图一(a)中,用户提供少量标注后,方法需要检测钻孔机、头盔等未见过的新颖类别目标。
尽管FSOD最近有了很显著的发展,但是大多数现有的方法在应用前都遵循基训练、小样本微调两阶段范式。然而微调阶段并不适用于机器人在线探索的应用场合,因为:
为此,我们提出了一种无需微调的小样本目标检测方法AirDet。如图一(b)所示,未经微调的AirDet甚至能取得比一些微调后的方法更好的结果。
图一. 来自机器人探索(DARPA Subt 挑战赛)的代表性图像和性能比较。实线表示没有微调的结果,虚线表示在少样本数据上微调后的结果。贡献图二展示了机器人自主探索任务的流程和AirDet的宏观模型结构。
任务流程在探索未知环境过程中,机器人首先将可能包含重要物体(如头盔)的原始图片发送给用户。用户会在线给出标注并提供少量样本。此后,机器人便可_立即_ 通过对后续环境的感知检测这些新类样本。
宏观结构AirDet宏观上包含四个模块
AirDet的模块设计理念均基于“与类别无关的关联性(class-agnostic relation)”。
具体而言,我们定义了如下两种关联性:空间尺度关联性 和特征通道关联性
空间尺度关联性: 目标的类别与其外观紧密相关, 而目标的外观由特征的空间维度描述。因此, 两 个特征的空间关联性可以很大程度上反映两个特征的相关程度(如相似性)。我们定义 如下:
其中, 是两个任意张量。Flatten 意味着将特征在空间尺度下展平。MLP 是常用的多层感知机, 故而 可以生成带有 的空间 信息的核, 此后使用逐通道卷积 便可计算 间的空间关联性 。
特征通道关联性: 在以往的研究中表明, 图片的类别信息通常存于特征通道中。譬如, 考虑两辆汽 车的深度特征, 其沿通道的分布是相似的。受此启发, 我们提出特征通道关联性模块 :
其中, 代表沿通道维度串联两个特征。
与类别无关的关联性贯穿AirDet每个子模块的设计,这使得AirDet无需微调即可工作。每个子模块的设计细节请有兴趣的读者参阅我们的原文或代码。
实验条件设定基训练集:
COCO2017 train数据集中非VOC的60类数据(等价于COCO2014 trainval中剔除5k测试图片)
测试集:
值得一提的是,由于AirDet无需微调,在所有测试数据,不同shot的设定中,我们都可采用同一个基训练出来的模型(而不需要针对不同的场景调整不同的微调超参数)。
COCOCOCO数据集上的结果比较。COCO上的结果显示,无需微调的AirDet已经比肩,甚至优于许多微调后的方案,微调后,AirDet的性能更加可观。无需微调的条件下,方法的结果对支持样本较敏感,故而我们随机采样了3-5组样本,展示了其平均结果和标准差,表中由 \dagger\dagger 表示。
COCO数据集上不同尺度的目标检测结果比较得益于AirDet中由支持样本引导,可学习多层特征联系的SCS模块(详见原文),AirDet在多尺度目标检测中也比已有的方案更优(优于采纳FPN的方案)。
值得一提的是,对于多尺度目标的检测,微调后的模型表现不一定更好。
COCO 10-shot 结果比较大多现有方案对于COCO数据集采纳10-shot场景,我们也给出AirDet 10-shot的结果如上表。(不过最新的CVPR2022中,COCO 10-shot已经能达到17-18 AP,不得不感慨CV发展的迅猛)
VOCVOC 跨领域结果比较通常机器人的工作环境与训练集有较大差别,我们展示的跨领域性能(COCO训练,VOC测试)如上表。
Subt 挑战赛图三. DARPA SubT挑战赛中的定性结果感觉放了好多表,SUBT就放一些定性图。左侧是提供给AirDet的新类样本,右侧是AirDet的检测结果,可见AirDet对真实探索环境中的尺度变化、照度变化等挑战因素较为鲁棒。
局限性无需微调的小样本目标检测研究甚少,目前可以不微调直接工作的仅有A-RPN和AirDet两个方法,而这个任务对机器人在位置环境中的探索感知又比较重要。为了这个领域未来能得到关注并发展的更好,我们也真诚摆出AirDet的局限性:
本文是我参加CMU RISS2021暑研期间的工作,从第一次讨论这个方向,到至今论文中稿已逾一年。非常感谢期间王晨博士和Scherer教授对我的指导帮助,也非常感谢pranay和Seungchan学长的协助合作。本文主要受A-RPN与《learning to compare》两篇文章启发,在此向文章的作者们致以真挚的谢意(代码基于FewX)。
本文仅做学术分享,如有侵权,请联系删文。
*博客内容为网友个人发布,仅代表博主个人观点,如有侵权请联系工作人员删除。