【翻译：OpenCV-Python教程】图像阈值

⚠️这个系列是自己瞎翻的，文法很丑，主要靠意会，跳着跳着捡重要的部分翻，翻错了不负责，就这样哈。

⚠️基于3.4.3，Image Thresholding，附原文。

目标

在本教程，你会学到简单的阈值化、自适应阈值化、大津阈值法等等。
你会学到这些方法：cv.threshold, cv.adaptiveThreshold 等等。

简单阈值化

在这的方法里，是事情就是一刀切的直白。如果一个像素值比阈值更大，就会被统统标记为一种颜色（比如白色），否则就被标记为另外一种颜色（比如黑色）。使用方法就是 cv.threshold 。第一个参数是原图，它应该是一个灰度图像。第二个参数是用来把所有图片像素点分离用的阈值。第三个参数代表了一旦大于（有时候是小于）阈值要被改变成的值。用第四个参数，OpenCV 提供了不同的阈值模式。不同的模式如下：

文档清楚的解释了每种类型类型代表啥意义。请查看文档。

这个方法包含了两个返回值。第一个返回值 retVal 我们晚点解释。第二个返回值代表了我们阈值化之后的图像。

代码：

import cv2 as cv
import numpy as np
from matplotlib import pyplot as plt
img = cv.imread('gradient.png',0)
ret,thresh1 = cv.threshold(img,127,255,cv.THRESH_BINARY)
ret,thresh2 = cv.threshold(img,127,255,cv.THRESH_BINARY_INV)
ret,thresh3 = cv.threshold(img,127,255,cv.THRESH_TRUNC)
ret,thresh4 = cv.threshold(img,127,255,cv.THRESH_TOZERO)
ret,thresh5 = cv.threshold(img,127,255,cv.THRESH_TOZERO_INV)
titles = ['Original Image','BINARY','BINARY_INV','TRUNC','TOZERO','TOZERO_INV']
images = [img, thresh1, thresh2, thresh3, thresh4, thresh5]
for i in xrange(6):
    plt.subplot(2,3,i+1),plt.imshow(images[i],'gray')
    plt.title(titles[i])
    plt.xticks([]),plt.yticks([])
plt.show()

提示

要绘制出多张图像，我们必须使用 plt.subplot() 方法。请查看 Matplotlib 的文档来获取更多信息。

结果给出如下：

自适应阈值化

在上一部分，我们使用的阈值是一个固定的全局数值。但它可能并不是在所有情况下都是最佳选择，比如图像的不同区域有着不同的光照条件时。在这种情况下，我们得使用自适应阈值化。这个方案中，算法会计算图像一个小范围中的阈值。然后我们在同一张图像的不同的区域，我们拿到不同的阈值，这就在处理光照变化的图像时给了我们一个更好的结果。

它有三个特殊的输入参数，以及一个返回值。

Adaptive Method - 这个参数决定了阈值如何计算。

cv.ADAPTIVE_THRESH_MEAN_C：阈值是周围区域的平均值。
cv.ADAPTIVE_THRESH_GAUSSIAN_C：阈值是一个加权过的、周围区域的和。而权重是一个高斯窗。（译者注：了解高斯窗，其实上一种就等于是所有周围区域有着相同的权重）

Block Size - 这个参数决定了周围区域的大小。

C - 第三个参数是从平均值或者加权平均值中减去的一个常数值。

以下代码片段为一张光照变化的图像比较了全局阈值化和自适应阈值化：

import cv2 as cv
import numpy as np
from matplotlib import pyplot as plt
img = cv.imread('sudoku.png',0)
img = cv.medianBlur(img,5)
ret,th1 = cv.threshold(img,127,255,cv.THRESH_BINARY)
th2 = cv.adaptiveThreshold(img,255,cv.ADAPTIVE_THRESH_MEAN_C,\
            cv.THRESH_BINARY,11,2)
th3 = cv.adaptiveThreshold(img,255,cv.ADAPTIVE_THRESH_GAUSSIAN_C,\
            cv.THRESH_BINARY,11,2)
titles = ['Original Image', 'Global Thresholding (v = 127)',
            'Adaptive Mean Thresholding', 'Adaptive Gaussian Thresholding']
images = [img, th1, th2, th3]
for i in xrange(4):
    plt.subplot(2,2,i+1),plt.imshow(images[i],'gray')
    plt.title(titles[i])
    plt.xticks([]),plt.yticks([])
plt.show()

结果：

大津阈值法

在第一部分，我告诉你们这还有一个返回值 retVal 。当咱们要做一个大津阈值法的时候，它就有用了，怎么用呢？

在全局阈值化的时候，我们使用了一个任意值来当阈值，对吧？那我们怎么才能知道，我们选的这个值好不好呢？答案是：试错法。但考虑到双峰图 （简单的说，双峰图就是一张图像的直方图（译者注：图像直方图），有两个峰值。）对这样的图像，我们可以近似的取一个双峰之间的中间值作为阈值，对吧？这就是大津阈值法做的事。所以简单的说，它通过图像，对一张双峰图自动的计算了一个阈值（对于非双峰图来说，二值化不会很准确。）。

为此，使用 cv.threshold() 方法，但传入一个额外的标识， cv.THRESH_OTSU。而对于阈值，简单的传入0即可。然后算法找到最佳的阈值，并且返回给你第另外一个返回值，retVal。如果大津阈值法并未被使用，retVal值就和你传入的阈值一样。

查看以下示例，输入图像是一张噪声较大的图像。首先，我用127作为一个全局阈值；在第二种情况下，我直接使用大津阈值法；第三种情况，我使用 5x5 高斯内核过滤图像以消除噪声，然后应用Otsu阈值处理。了解噪声过滤如何改善结果。

import cv2 as cv
import numpy as np
from matplotlib import pyplot as plt
img = cv.imread('noisy2.png',0)
# global thresholding
ret1,th1 = cv.threshold(img,127,255,cv.THRESH_BINARY)
# Otsu's thresholding
ret2,th2 = cv.threshold(img,0,255,cv.THRESH_BINARY+cv.THRESH_OTSU)
# Otsu's thresholding after Gaussian filtering
blur = cv.GaussianBlur(img,(5,5),0)
ret3,th3 = cv.threshold(blur,0,255,cv.THRESH_BINARY+cv.THRESH_OTSU)
# plot all the images and their histograms
images = [img, 0, th1,
          img, 0, th2,
          blur, 0, th3]
titles = ['Original Noisy Image','Histogram','Global Thresholding (v=127)',
          'Original Noisy Image','Histogram',"Otsu's Thresholding",
          'Gaussian filtered Image','Histogram',"Otsu's Thresholding"]
for i in xrange(3):
    plt.subplot(3,3,i*3+1),plt.imshow(images[i*3],'gray')
    plt.title(titles[i*3]), plt.xticks([]), plt.yticks([])
    plt.subplot(3,3,i*3+2),plt.hist(images[i*3].ravel(),256)
    plt.title(titles[i*3+1]), plt.xticks([]), plt.yticks([])
    plt.subplot(3,3,i*3+3),plt.imshow(images[i*3+2],'gray')
    plt.title(titles[i*3+2]), plt.xticks([]), plt.yticks([])
plt.show()

结果：

大津二值化如何工作？

本节演示了大津二值化的Python实现，显示了它实际上是怎么工作的，如果你不感兴趣，你可以跳过这里。

既然我们要弄的是一张双峰图，大津算法尝试找打一个阈值 (t)，使得加权内方差最小化，公式关系如下：

$\sigma_w^2(t) = q_1(t)\sigma_1^2(t)+q_2(t)\sigma_2^2(t)$

其中：

$q_1(t) = \sum_{i=1}^{t} P(i) \quad \& \quad q_2(t) = \sum_{i=t+1}^{I} P(i)$

$\mu_1(t) = \sum_{i=1}^{t} \frac{iP(i)}{q_1(t)} \quad \& \quad \mu_2(t) = \sum_{i=t+1}^{I} \frac{iP(i)}{q_2(t)}$

$\sigma_1^2(t) = \sum_{i=1}^{t} [i-\mu_1(t)]^2 \frac{P(i)}{q_1(t)} \quad \& \quad \sigma_2^2(t) = \sum_{i=t+1}^{I} [i-\mu_2(t)]^2 \frac{P(i)}{q_2(t)}$

它实际上找到了一个 t 值，在两个峰值之间，这样划分出来的两个类别的方差是最小的。它可以简单的在Python中实现如下：

img = cv.imread('noisy2.png',0)
blur = cv.GaussianBlur(img,(5,5),0)
# find normalized_histogram, and its cumulative distribution function
hist = cv.calcHist([blur],[0],None,[256],[0,256])
hist_norm = hist.ravel()/hist.max()
Q = hist_norm.cumsum()
bins = np.arange(256)
fn_min = np.inf
thresh = -1
for i in xrange(1,256):
    p1,p2 = np.hsplit(hist_norm,[i]) # probabilities
    q1,q2 = Q[i],Q[255]-Q[i] # cum sum of classes
    b1,b2 = np.hsplit(bins,[i]) # weights
    # finding means and variances
    m1,m2 = np.sum(p1*b1)/q1, np.sum(p2*b2)/q2
    v1,v2 = np.sum(((b1-m1)**2)*p1)/q1,np.sum(((b2-m2)**2)*p2)/q2
    # calculates the minimization function
    fn = v1*q1 + v2*q2
    if fn < fn_min:
        fn_min = fn
        thresh = i
# find otsu's threshold value with OpenCV function
ret, otsu = cv.threshold(blur,0,255,cv.THRESH_BINARY+cv.THRESH_OTSU)
print( "{} {}".format(thresh,ret) )

*（一些方法也许你不熟悉，但我们会在即将到来的章节里再提到。）*

额外资源

Digital Image Processing, Rafael C. Gonzalez（Rafael C. Gonzalez写的数字图像处理）

练习

大津二值化方法还有一些可用的优化方案，你可以自行搜索并且实现它们。

上篇：【翻译：OpenCV-Python教程】图像的几何变换

下篇：【翻译：OpenCV-Python教程】图像平滑