相对姿态估计
1.非深度学习技术
对于RGBD扫描的相对姿态估计,通常用到的方法采用三步法,例如经典的4PCS 算法、以及改进版的super-4pcs【2】算法。第一步是从每个扫描中提取特征,第二步是建立提取特征之间的对应关系,第三步是对于具有特征关联一致性的特征子集拟合一个刚性变换。但是这些方法依赖于每个部分的参数设置,并且要求两个扫描输入之间有足够多的重叠特征进行匹配。
注:
Super-4pcs算法:
Super-4PCS算法来源于4PCS算法,其基本思想是基于RANSAC算法,只是对确定对应点对的策略进行了优化。RANSAC中是随机选择三个点对来估计转换矩阵,而4pcs中以源点云中共面的四点为基,在目标点云中寻找对应的四点,以构成四组对应点,相比而言增强算法的鲁棒性。四点一致集算法的理论基础在于共面四点对的仿射不变性。
在仿射变换中,对于给定的非全共线的共面四点a、b、c、d,ab与cd相交于点e,可得到两个比例r1和r2:
r1=|a-e||a-b|
r2=|c-e||c-d|
利用仿射变换中r1与r2的不变性,在目标点云中寻找对应的4点集,计算对应的变换关系。
2.深度学习技术
基于深度学习的方法进行相对姿态估计中,常规方法采用常见的物体匹配方式(类似于非深度学习技术的三步法),只是每一步都采用神经网路进行计算。比如特征提取网络提取特征,使用关联模块来估计对应关系和计算刚性变换。然而他们仍然需要丰富的重叠区域来进行相对姿态估计。
最近很多研究提出利用循环结构对物体匹配进行优化。
a.‘Deep Fundamental Matrix Estimation”【3】中作者提出了一种计算加权对应关系的循环结构,使用神经网络估计权重,将模型拟合问题转化为一系列加权最小二乘问题求解,用于估计两幅图像之间的基本矩阵,它只要是解决第三步,拟合一个刚性变换。
b.“Recurrent Transformer Networks for Semantic Correspondence”【4】中,这篇文章提出了一个循环转换网络(Recurrent Transformer Networks, RTNs)来获取语义相似的图像之间的对应关系。RTN通过迭代 估计输入图像之间的空间变换关系,并使用空间变换关系生成对齐的卷积层**层来得到最终的输出结果。整个过程是以递归的方式提升转换关系的估计和特征表示。此外,还提出了一种基于该分类损失函数的RTN弱监督训练技术,在语义相关的几个标准上达到了优秀的结果。
图 1 RTN 网络流程
RTN网络由基于STN的特征提取网络和几何匹配网络的循环结构组成,迭代推导仿射变换残差提高了匹配精度,并促进了收敛。