OpenCV3学习(8.2)——直方图相似度比较(compareHist)与EMD距离
对输入的两张图像进行直方图均衡化及直方图计算步骤后,可以对两个图像的直方图进行对比,并通过对比的结果得到一些我们想要的结论。
3.直方图比较应用
(1)图像相似度比较
如果我们有两张图像,并且这两张图像的直方图一样,或者有极高的相似度,那么在一定程度上,我们可以认为这两幅图是一样的,这就是直方图比较的应用之一。
(2)分析图像之间关系
两张图像的直方图反映了该图像像素的分布情况,可以利用图像的直方图,来分析两张图像的关系。
4.直方图比较原理
要比较两个直方图(H1 和 H2),首先必须要选择一个衡量直方图相似度的对比标准,我们设为d(H1,H2),
对输入的两张图像计算得到直方图H1与H2,归一化到相同的尺度空间,然后可以通过计算H1与H2的之间的距离得到两个直方图的相似程度进而比较图像本身的相似程度。Opencv提供的比较方法有四种:
Correlation 相关性比较 ( CV_COMP_CORREL 0)
Chi-Square 卡方比较 ( CV_COMP_CHISQR 1)
Intersection 十字交叉性 ( CV_COMP_INTERSECT 2)
Bhattacharyya distance 巴氏距离 ( CV_COMP_BHATTACHARYYA 3)
compareHist函数返回一个数值,相关性方法范围为0到1,1为最好匹配,卡方法和Bhattacharyya距离法是值为0最好,而交集法为值越大越好。函数原型:
CV_EXPORTS_W double compareHist( InputArray H1, InputArray H2, int method );
//! compares two histograms stored in sparse arrays
CV_EXPORTS double compareHist( const SparseMat& H1, const SparseMat& H2, int method );
1)相关,Correlation(method=CV_COMP_CORREL)
其中: N等于直方图中bin的个数
如果H1 = H2,即两个图的直方图一样,分子等于分母,值为1,所以在不严格的情况下,当值为1时,可以认为两个图是一样的。但是也有可能会出现两个图不一样,但是两个图的直方图是一样的情况。因为直方图计算的是像素点个数的分布情况,但是不会显示像素点的位置,所以有可能会出现两幅图片不一样,但是相同像素的个数完全一样,那他们的直方图也是一样的,不过这种情况,不常有。
2)卡方,Chi-Square(method=CV_COMP_CHISQR)
通过这个公式我们能够发现,卡方比较和相关性比较恰恰相反,相关性比较的值为0,相似度最低,越趋近于1,相似度越低;卡方比较则是,值为0时说明H1= H2,这个时候相似度最高。 卡方比较来源于卡方检验,卡方检验就是统计样本的实际观测值与理论推断值之间的偏离程度,实际观测值与理论推断值之间的偏离程度就决定卡方值的大小,卡方值越大,越不符合;卡方值越小,偏差越小,越趋于符合,若两个值完全相等时,卡方值就为0,表明理论值完全符合。
3)Intersection(十字交叉性)(method-CV_COMP_INTERSECT)
对比H1,H2并求出最小值,最后求和。
4)Bhattacharyya距离,(method=CV_COMP_BHATTACHARYYA)
在直方图相似度计算时,巴氏距离获得的效果最好,但计算是最为复杂的。巴氏距离的计算结果,其值完全匹配为1,完全不匹配则为0。
图像相似性度量-------EMD
EMD算法是用来比较两幅图像相似性的方法。在颜色直方图中,由于光线等的变化会引起图像颜色值的漂移,它们会引起颜色值位置的变化,从而导致直方图匹配失效。对于两个形状相同,但只是相对平移的两个直方图,距离度量会给出一个很大的值,我们需要一个对这种平移不敏感的距离度量方法。EMD的思想是求得从一幅图像转化为另一幅图像的代价,用直方图来表示就是求得一个直方图转化为另一个直方图的代价,代价越小,越相似。
所以EMD可以理解为:直方图A转化为直方图B时,需要把A中的每一个bin进行分割给B中的每一个bin,在乘上bin之间的代价。(以下是个人理解)假如:A和B都有两个bin,且A到B的距离代价分别为0.4和0.7;A的bin1为0.5,且分成0.1和0.4给B的bin1和bin2,同样,A的bin2分成0.3和0.2给B,则EMD=0.4*0.1+0.7*0.4+0.4*0.3+0.7*0.2
EMD( InputArray signature1, InputArray signature2,
int distType, InputArray cost=noArray(),
float* lowerBound=0, OutputArray flow=noArray() );
signature1 大小为 size1×(dims+1) 的浮点数矩阵,每一行依次存储点的权重和点的坐标。矩阵允许只有一列(即仅有权重),如果使用用户自定义的代价矩阵。
signature2 与 signature1 的格式一样size2×(dims+1),尽管行数可以不同(列数要相同)。当一个额外的虚拟点加入 signature1 或 signature2 中的时候,权重也可不同。
distance_type 使用的准则, CV_DIST_L1, CV_DIST_L2, 和 CV_DIST_C 分别为标准的准则。
cost自定义大小为 size1×size2 的代价矩阵。
flow 产生的大小为 size1×size2 流矩阵(flow matrix): flowij 是从 signature1 的第 i 个点到 signature2 的第 j 个点的流(flow)。
lowerbound 可选的输入/输出参数:两个签名之间的距离下边界,是两个质心之间的距离。如果使用自定义代价矩阵,点集的所有权重不等,或者有签名只包含权重(即该签名矩阵只有单独一列),则下边界也许不会计算。用户必须初始化 *lower_bound. 如果质心之间的距离大于获等于 *lower_bound (这意味着签名之间足够远), 函数则不计算 EMD. 任何情况下,函数返回时 *lower_bound 都被设置为计算出来的质心距离。因此如果用户想同时计算质心距离和T EMD, *lower_bound 应该被设置为 0.
实例展示:
a.加载图像
b.将图像从BGR空间转化为HSV空间
c.计算直方图并归一化处理
d.直方图比较
e.展示图像
#include<iostream>
#include<opencv2\opencv.hpp>
using namespace std;
using namespace cv;
int main() {
//直方图相似度比较
vector<Mat> src;//迭代器push_back
Mat temp = imread("0.jpg", 1);
int m=temp.rows / 2;
int n = temp.cols;
//将一幅图分割为上下两部分
Mat image_cut =Mat(temp, Rect(0, 0, n, m)).clone();//Rect(x,y,w,h)
Mat image_cut2 = Mat(temp, Rect(0, m, n, m)).clone();
src.push_back(image_cut); src.push_back(image_cut2);
temp = imread("1.jpg", 1);
src.push_back(temp);
temp = imread("2.jpg", 1);
src.push_back(temp);
vector<Mat> hsv(4), hist(4),hist_img(4);
int scale=10,histSize[] = { 8,8 }, ch[] = { 0,1 };//30rows,32cols
float h_ranges[] = { 0,180 };
float s_ranges[] = { 0,255 };
const float* ranges[] = { h_ranges,s_ranges };
for (int i = 0; i < 4 ; i++) {
cvtColor(src[i], hsv[i], COLOR_RGB2HSV);
calcHist(&hsv[i], 1, ch, noArray(), hist[i], 2, histSize, ranges, true);
normalize(hist[i], hist[i], 0, 255, NORM_MINMAX);
hist_img[i]=Mat::zeros(histSize[0] * scale, histSize[1] * scale, CV_8UC3);
for (int h = 0; h < histSize[0]; h++) {
for (int s = 0; s < histSize[1]; s++) {
float hval = hist[i].at<float>(h, s);
rectangle(hist_img[i], Rect(h * scale, s * scale, 10, 10), Scalar::all(hval), -1);
}
}
}
//display
imshow("0", src[0]); imshow("1", src[1]); imshow("2", src[2]); imshow("3", src[3]);
imshow("hist0", hist_img[0]); imshow("hist1", hist_img[1]); imshow("hist2", hist_img[2]); imshow("hist3", hist_img[3]);
for (int i = 0; i < 4; i++)
{
cout << "hist[0] vs hist[" << i <<"]"<< endl;
for (int j = 0; j < 4; j++) {
cout << "method[" << j <<"]"<< compareHist(hist[0], hist[i], j)<<endl;
}
}
//do EMD
vector<Mat> sig(4);
for (int i = 0; i < 4; i++) {
vector<Vec3f> sigv;
normalize(hist[i], hist[i], 1, 0, NORM_L1);
for (int h = 0; h < histSize[0]; h++)
for (int s = 0; s < histSize[1]; s++) {
float hval = hist[i].at<float>(h, s);
if (hval != 0)
sigv.push_back(Vec3f(hval, (float)h, (float)s));
}
sig[i] = Mat(sigv).clone().reshape(1);
if (i > 0)
cout << EMD(sig[0], sig[i], CV_DIST_L2) << endl;
}
waitKey();
}
结果:
原图像src存放4张图片,0,1是一张亮的手掌图片的上下两部分,2,3亮度变暗,将4张图片转换HSV空间,计算直方图。
下面是图0与4张图片的直方图相似度的比较:
EMD结果: