BMVC2009 Integral Channel Features

这篇文章看主页应该是$巨苣在Detection领域发的第一篇论文。主要讲的就是在积分图的基础上可以衍生出一大堆的特征,而他们经过对比实验发现LUV+Grad+Hist组成的ChnFtrs特征,结合适当的boosting算法,在当时来说性能是state-of-the-art的。这篇文章是后续10年BMVC那篇”The Fastest Pedestrain Detector in the West”的前期铺垫,思路比较简单。

$当时觉得学术环境太偏向于设计更强的学习算法,而忽略了对特征本身的分析和优化,于是他就基于积分图产生的各种特征进行分析组合,去设计了一种对行人检测友好的特征。
BMVC2009 Integral Channel Features
图一说的是,图像的特征通道其实可以理解为,对原图像的按不同方式进行变换所求得的不同特征图,例如局部求和、直方图和harr小波等,而这些特征计算方式又特别容易用积分图的方式计算出来,所以可称作积分通道特征。

下面的图二展示了积分通道的一些例子。注意图一说的是图像可以有这么多特征,图二特指图像的积分通道特征。
BMVC2009 Integral Channel Features

关于平移不变特征(色彩,线性滤波,非线性变换,像素变换,积分直方图,梯度直方图等)的具体细节在原文第二节。
关于积分通道特征(尺度,参数,优化,计算时间,特征生成,Boosting训练,非极大抑制等)的实现方式在原文第三节。

文中特别提了一下pre和post的区别:
Pre-smoothing:平滑的是原图像。抑制了图像噪声,但失去了细微的尺度结构特征;
Post-smoothing:平滑的是产生的特征通道。一定程度上决定并集成了尺度信息,但集成尺度常受到局部累积和的影响,使得post的作用变小。
BMVC2009 Integral Channel Features
图三示意了作者选用LUV+Grad+Hist通道组合的图像特征图,图中指出了某些通道对行人的肩部、头部具有显著性响应。

BMVC2009 Integral Channel Features
BMVC2009 Integral Channel Features
图四图五显示了作者实验的结果。图四探究的是特征中的各参数、学习算法对性能(漏检率mr和误报率fppi)的影响,总结了一套有效的参数,并得出boosting算法选择对结果影响不大;图五说明的是市面上各种算法在INRIA和Caltech数据集上的表现,除了在Full Image上比LatSvm-v2差以外,其他都state-of-the-art。