走进opencv-python 6 Canny边缘检测和图像金字塔
前言
本节将要介绍canny边缘检测和图像金字塔。
一、canny边缘检测
1 原理
Canny 边缘检测是一种非常流行的边缘检测算法,是 John F.Canny 在1986 年提出的。它包含如下几步:
1.1 噪声去除
由于边缘检测很容易受到噪声影响,所以第一步是使用 5x5 的高斯滤波器去除噪声,这个前面我们已经介绍过。
1.2 计算图像梯度
对平滑后的图像使用 Sobel 算子计算水平方向和竖直方向的一阶导数(图像梯度)(Gx 和 Gy)。根据得到的这两幅梯度图(Gx 和 Gy)找到边界的梯度和方向,公式如下:
梯度的方向一般总是与边界垂直。梯度方向被归为四类:垂直,水平,和两个对角线。
1.3 非极大值抑制
在获得梯度的方向和大小之后,应该对整幅图像做一个扫描,去除那些非边界上的点。对每一个像素进行检查,看这个点的梯度是不是周围具有相同梯度方向的点中最大的。如下图所示:
现在你得到的是一个包含“窄边界”的二值图像。
1.4 滞后阈值
现在要确定那些边界才是真正的边界。这时我们需要设置两个阈值:minVal 和 maxVal。当图像的灰度梯度高于 maxVal 时被认为是真的边界,那些低于 minVal 的边界会被抛弃。如果介于两者之间的话,就要看这个点是否与某个被确定为真正的边界点相连,如果是就认为它也是边界点,如果不是就抛弃。如下图:
A 高于阈值 maxVal 所以是真正的边界点,C 虽然低于 maxVal 但高于minVal 并且与 A 相连,所以也被认为是真正的边界点。而 B 就会被抛弃,因为他不仅低于 maxVal 而且不与真正的边界点相连。所以选择合适的 maxVal和 minVal 对于能否得到好的结果非常重要。在这一步一些小的噪声点也会被除去,因为我们假设边界都是一些长的线段。
在 OpenCV 中只需要一个函数:cv2.Canny(),就可以完成以上几步。第一个参数是输入图像。第二和第三个分别是 minVal 和 maxVal。apertureSize用来计算图像梯度的 Sobel卷积核的大小,默认值为 3。最后一个参数是 L2gradient,它可以用来设定求梯度大小的方程。如果设为 True,就会使用我们上面提到过的方程,否则使用方程:. 代替,默认值为 False。
import cv2
import numpy as np
filenames = 'longmao.png'
img = cv2.imread(filenames)
cv2.imshow('orginal',img)
#canny边缘检测
ret = cv2.Canny(img,100,200)
cv2.imshow('canny',ret)
cv2.waitKey(0)
cv2.destroyAllWindows()
结果:
这段代码只是静态的,我们加载滚动条来设置minVal,maxVal
import cv2
import numpy as np
lowThreshold = 0
max_lowThreshold = 50
ratio = 3
def CannyThreshold(lowThreshold):
detected_edges = cv2.Canny(img, lowThreshold, lowThreshold * ratio)
dst = cv2.bitwise_and(img, img, mask=detected_edges) # just add some colours to edges from original image.
cv2.imshow('canny demo', dst)
filenames = 'longmao.png'
img = cv2.imread(filenames,0)
cv2.namedWindow('canny demo')
#参数分别为滑条名,窗口名,滑条初始位置,调节范围(0-max_lowThreshold),回调函数
cv2.createTrackbar('Min threshold', 'canny demo', lowThreshold, max_lowThreshold, CannyThreshold)
#初始化第一次显示
CannyThreshold(0)
if cv2.waitKey(0) == 27:
cv2.destroyAllWindows()
结果:
二 图像金字塔
一般情况下,我们要处理是一副具有固定分辨率的图像。但是有些情况下,我们需要对同一图像的不同分辨率的子图像进行处理。比如,我们要在一幅图像中查找某个目标,比如脸,我们不知道目标在图像中的尺寸大小。这种情况下,我们需要创建创建一组图像,这些图像是具有不同分辨率的原始图像。我们把这组图像叫做图像金字塔(简单来说就是同一图像的不同分辨率的子图集合)。如果我们把最大的图像放在底部,最小的放在顶部,看起来像一座金字塔,故而得名图像金字塔。
有两类图像金字塔:高斯金字塔和拉普拉斯金字塔。
高斯金字塔的顶部是通过将底部图像中的连续的行和列去除得到的。顶部图像中的每个像素值等于下一层图像中 5 个像素的高斯加权平均值。这样操作一次一个 MxN 的图像就变成了一个 M/2xN/2 的图像。所以这幅图像的面积就变为原来图像面积的四分之一。这被称为 Octave。连续进行这样的操作我们就会得到一个分辨率不断下降的图像金字塔。我们可以使用函数cv2.pyrDown() 和 cv2.pyrUp() 构建图像金字塔。
函数 cv2.pyrDown() 从一个高分辨率大尺寸的图像向上构建一个金子塔(尺寸变小,分辨率降低)。
down1 = cv2.pyrDown(img)
cv2.imshow('down1',down1)
结果:
函数 cv2.pyrUp() 从一个低分辨率小尺寸的图像向下构建一个金子塔(尺寸变大,但分辨率不会增加)。
img = cv2.imread(filenames)
cv2.imshow('img',img)
down1 = cv2.pyrDown(img)
cv2.imshow('down1',down1)
up1 = cv2.pyrUp(down1)
cv2.imshow('up1',up1)