Very fast template matching(非常快的模板匹配)
主要讲述文章“Very Fast Template Matching” 中用到的特征和算法的基本思路。(用尽量少的公式)
Integral image
本文作者从2001 年人脸识别神作 “Robust Real-time Object Detection” 中提到的图片特征 integral image中得到启发,发现这个特征可以作为模板匹配的特征,并且通过快速计算图片某个位置对应的代数矩达到快速匹配的目的。假定I(x,y)代表一张图片,则该图片中任意一个点(x,y)对应的integral image的值是该点所在图片中左方和上方所有像素的和,如图:

Integral image的好处是,当一张图片的integral image已知,这张图片的任何一个区域的像素的总和可以以极快的速度计算出来。

例如,如果我们对图片I(x,y)中的区域D感兴趣,那么在integral image中我们通过计算点1,2,3,4对应的值就能得到图片I(x,y)中的区域D的像素的总和,也就是integral image中的:4+1−3−2。
代数矩的快速计算
上一部分简要介绍了integral image的定义和在图片像素计算中的优点,这里以integral image为基础,介绍图片特定的点(x,y)的代数矩的计算方式。这也是本文作者的创新点。
一个矩形区域 I 的代数矩定义为:
mpq=x=xa∑xby=ya∑ybxpyqI(x,y)(1)
假设x0,y0代表该矩形的中心,定义这个矩形的中心距为:
upq=x=xa∑xby=ya∑yb(x−x0)p(y−y0)qI(x,y)(2)
中心距和代数矩满足展开式:
u00=m00
u10=m10−x0m00
u01=m01−y0m00
u20=m20−2x0m10+x02m00
u11=m11−x0m01−y0m10+x0y0m00
u02=m02−2y0m01+y02m00
…
计算代数矩和中心距的原因是,作者希望通过以中心距的一组值作为特征用于模板匹配。计算代数矩的速度类似于计算integral image, 在计算时能够对图像矩阵进行直接操作。
快速模板匹配
设模板匹配任务中的模板为T图片为I,像素值均表示为f(x,y),一般选p=2,q=2
通过上述介绍,我们不难得到模板T的中心距UT=(u00T,...,upqT),定义
UI(u,v)=(u00I,...,upqI)为中心在(u,v)的矩形的中心距。通过计算模板与图片中每一个点对应的中心距的“距离”,来判定模板匹配的位置。例如
h(u,v)=(∑p,q(upqI(u,v))2)∑p,qupqI(u,v)upqt(3)
h(u,v)的值最大的点对应最准确的匹配点。
但是这样计算出的h(u,v)对于噪声比较敏感,所以文章提供了另外一个思路:
在以归一化互相关为特征的模板匹配计算方式为:
h(u,v)=(∑x,yI2(u+x,v+y)∑x,yI(u+x,v+y)T(x,y)(4)
通过多项式p对像素I进行近似,将上式转变为:
h(u,v)=UI′(u,v)B−1UI(u,v)UI′(u,v)B−1Ut(6)
推导请移步论文 https://download.****.net/download/tiffanyxyf/11171370。
算法步骤
1.计算出模板的中心距
2. 计算出图片的每一阶integral image
3. 计算出图片中每一个可能成为矩形中心的点中心距
4. 根据计算出的图片和模板的中心距计算特征
5. 得到特征最大的点,也就是模板匹配的结果。
结果
模板和图片如下:


我的matlab仿真结果:

代码移步: