方案四 orb&颜色直方图&hog
携程技术方案
对于酒店中的相同/相似图像,大部分全局特征(比如颜色、纹理和HOG)不能很好地解决图像裁剪残缺和旋转变化等问题;一些局部特征(比如SIFT和SURF)与基于深度学习的特征虽然表达效果较好,但是由于特征提取复杂,计算速度过于缓慢。
针对以上特征提取方法存在的缺陷,我们最终采用ORB特征作为图像的特征表达,并使用汉明距离进行相似度的计算。ORB特征具有以下优点:1)特征提取速度快;2)在大多数情况下,去重效果能够与SIFT/SURF持平;3)提取的特征直接是二元编码形式,无需使用哈希学习方法就可以直接利用汉明距离快速计算相似度。
ORB特征在实际的图像去重过程中仍然存在一些不足,比如在处理图像尺寸差异过大、形变和模糊等问题时,去重效果一般。为此我们在提取ORB特征前,首先将图像按照初始的宽高比例统一缩放到一个固定的标准尺寸之内,避免了图像之间的尺寸差异,较好地弥补了ORB特征不具有尺度不变性的缺陷。同时,我们在面对图像形变和模糊问题时,在ORB特征的基础上,进一步融合了颜色直方图和LBP特征等全局特征来进行重复图像判定,令局部和全局的图像信息之间优势互补,降低了形变和模糊等因素对ORB特征的影响,保证了图像去重的准确率。
参考链接:http://www.10tiao.com/html/183/201705/2697266056/1.html