【论文笔记】【ICRA2019】基于地标的图像表示以改善特征点的匹配
从图上来看,地标提取的有些冗余???:
本文的目的
解决光照、视点变化给闭环检测带来的问题。(但是闭环最大的问题可能是到了同一个地点,但是朝着不同的方向怎么办?多加写相机将一个点的所有方向的场景特征都组合起来???)利用更高层级的约束,目标(地标级别)的约束。
本文的原理
充分利用神经网络提取特征的不变性和地标相对于单一特征点的鲁棒性, 通过网络提取图像中的地标并且编码其特征,然后匹配的时候,先进行地标级别的匹配,然后在匹配上的地标中,再进行特征点的匹配。
最终效果
在光照和视点变化较大的数据集上验证,性能好于传统的关键点的匹配。
可以升级的地方
从作者给出的图像可以看出,地标的提取很不准确,这里可以结合当前的注意力机制
整个的流程:
1.从两个图像上提取地标
2.计算两个地标的特征并进行匹配(两个特征之间的距离)
3.在已经匹配上的地标对上进行特征点的匹配,并对匹配的点对进行剪枝
4.组合全图的匹配点并使用RANSAC剔除异常点得到最终的好点。
相关细节
1.提取目标作为地标:BING,24ms,每张图100个地表proposals
能不能换用shffulenet之类的
2.将地标的卷积特征作为描述子:AlexNet
论文研究显示,网络的中层特征更能提取物体特征的不变性部分,作者采用AlexNet的第三层卷积特征,其具有更好的不变性。
描述子的相似度采用余弦距离来度量。要求保证相互一致性。此外,还要求了提取的地标的buonding box具有形状相似性:
匹配的地标对的两个对应的边界框必须在以下意义上具有足够的几何相似性:
w和h表示匹配上的box对的尺寸,r是大于1的常量,设为1.3
3.进一步的特征点的匹配:匹配点—>剪枝
1)作者发现,一个标记的边界框越大,仅通过剪枝技术匹配的关键字之间的误报就越多。因此,根据box大小来筛选地标匹配对:
w和h是全图的尺寸,前者是该box的尺寸,需要满足一定的关系,s设为0.6
2)在剩余的匹配对上进行关键点的检测生成关键点对
3)对生成的关键点对进行相互一致性检测,剔除部分关键点对
4)进行RANSAC进一步剔除异常点