Geo-localization论文阅读list1

Geo-localization论文阅读list1

从Week16开始,博主主要工作转为阅读Geo-localization专业论文,鉴于专业论文和深度学习基础论文的特点差异,专业论文总结将会以一个一个的list呈现。

1.Learning Deep Representations for Ground-to-Aerial Geolocalization

1.1 Thinkings

 论文的motivation是从大量geo-tagged images的利用开始,催生了许多ground-to-ground的geolocalization方法。但即使是ground-level reference photos再多,受到其视角范围的限制,还是难以做到地球全覆盖,所以短期之内利用ground-level photos作为geo-reference难以做到大范围的图像定位。所以,本论文利用航空影像作为geo-reference,采用匹配的方式来实现对ground-level photos的定位。受到了深度学习在人脸验证上面所取得成功的启发,作者提出了一个叫Where-CNN的网络框架,将ground-to-aerial geolocalization这个问题看作一个图像检索的问题进行解决。
 作者在这里也提出了匹配这些disparate visual domains主要存在两大难点

  1. 几何上面,每种视角都会有着大量的遮挡。例如,对于同一个房子来说,街景视角会有树木遮挡,而鸟瞰视角又只能看见这个房子的房顶。
  2. 同一地点的不同视角图片在不同的光照、气候、季节下面拍摄。

 总体来说,这篇论文的contributions主要由以下三个方面

  1. 本论文的方法利用航空图片作为geo-reference,而无需利用ground-level photos作为geo-reference,克服了ground-level photos难以做到大面积覆盖的缺点。
  2. 论文介绍了一个从公开数据源中创建大尺度cross-view数据集的方法。
  3. 论文还做了传统计算机视觉features和几个不同深度学习策略的对比。

1.2 Principle Analysis

Geo-localization论文阅读list1
 如上图所示,作者的Where-CNN就是利用了Siamese network的结构,将cross-view匹配问题转换为一个图像检索的问题(人脸验证)。这里作者使用的backbone是pre-trained AlexNet。

1.3 Weakness

  1. 在测试的时候需要对没有metadata的ground-level query images进行尺度和深度的估计。
  2. ground-level query images的绝对方位可能会不知道,所以需要挨个试一下。