CVPR 2018 LSART:《Learning Spatial-Aware Regressions for Visual Tracking》论文笔记
理解出错之处望不吝指正。
本文模型叫做LSART。本模型主要分为两条线:(1).Spatial-Aware KRR;(2).Spatial-Aware CNN。
Spatial-Aware KRR:KRR with Cross-Patch Similarity(KRRCPS)
传统的岭回归:
根据representer theorem(表示定理),这个优化问题可以写为:
本文提出了一个新颖的核函数,考虑了两个样本之间的所有的patches之间的相似度(这里
表示权重):
通过变形,可以将问题变为(这里表示权重向量):
把函数中响应项单独拿出来,可以写成以下形式:
这里A、B、C分别对应下图中的一个模块。
Spatial-Aware CNN:CNN with Spatially Regularized Kernels(CNNSRK)
通过在卷积层中加入spatial正则项,使模型考虑spatial信息(进过卷积层后除了focus的位置,其他均置0):
上式即为一个卷积层的操作,即为我们加入的spatial正则项,
为卷积操作。
训练阶段模型结构:
测试阶段模型结构:
最终tracking时要结合这两部分: