图像形态学操作时候,可以通过自定义的结构元素实现结构元素对输入图像一些对象敏感、另外一些对象不敏感,这样就会让敏
感的对象改变而不敏感的对象保留输出。通过使用两个最基本的形态学操作 – 膨胀与腐蚀,使用不同的结构元素实现对输入图像的操作、得到想要的结果。
常见的形状:矩形、园、直线、磁盘形状、砖石形状等各种自定义形状
提取步骤:
输入图像彩色图像 imread
转换为灰度图像 – cvtColor
转换为二值图像 – adaptiveThreshold
定义结构元素
开操作 (腐蚀+膨胀)提取 水平与垂直线
取什么样的结构元素是形态学操作应用的关键点
代码
#include "../common/common.hpp"
void main(int argc, char** argv)
{
Mat src, gray, binImg1, binImg2, temp1, dst1, temp2, dst2, dst3;
src = imread(getCVImagesPath("images/bin1.png"), IMREAD_COLOR);
imshow("src", src);
cvtColor(src, gray, COLOR_BGR2GRAY);
imshow("gray", gray);
/*
adaptiveThreshold(
Mat src, // 输入的灰度图像
Mat dest, // 二值图像
double maxValue, // 二值图像最大值
int adaptiveMethod // 自适应方法,只能其中之一 –
// ADAPTIVE_THRESH_MEAN_C , ADAPTIVE_THRESH_GAUSSIAN_C
int thresholdType,// 阈值类型 THRESH_BINARY THRESH_BINARY_INV 阈值 T = sum(blockSize X blockSize的像素平均值) - 常量C
int blockSize, // 块大小
double C // 常量C 可以是正数,0,负数
)
*/
adaptiveThreshold(gray, binImg1, 255, ADAPTIVE_THRESH_MEAN_C, THRESH_BINARY, 15, -2);//adaptiveThreshold 将灰度图转换为二值图
imshow("binImg1", binImg1);
//~gray 表示将图像中的像素黑变白,白变黑,需要使用 ~gray 才能使转换的二值图的特征与原图差不多
adaptiveThreshold(~gray, binImg2, 255, ADAPTIVE_THRESH_MEAN_C, THRESH_BINARY, 15, -2);
imshow("binImg2", binImg2);
Mat hline = getStructuringElement(MORPH_RECT, Size(src.cols / 16, 1), Point(-1, -1));//Size水平线的宽度要大于原图的垂直线的宽度,小于原图水平线的宽度
Mat vline = getStructuringElement(MORPH_RECT, Size(1, src.rows / 8), Point(-1, -1));//Size竖直线的高度要大于原图的水平线的高度,小于原图垂直线的高度
//提取水平线
erode(binImg2, temp1, hline);
dilate(temp1, dst1, hline);//这两步就是开操作
imshow("temp1", temp1);
bitwise_not(dst1, dst1);//颜色反转一下,背景变成白色好看些。。
imshow("dst1", dst1);
//提取竖直线
erode(binImg2, temp2, vline);
dilate(temp2, dst2, vline);
imshow("temp2", temp2);
bitwise_not(dst2, dst2);//颜色反转一下,背景变成白色好看些。。
imshow("dst2", dst2);
//将水平线与竖直线合到一张图上,还有其他的方式吗?
addWeighted(dst1, 0.5, dst2, 0.5, 0.0, dst3);
adaptiveThreshold(~dst3, dst3, 255, ADAPTIVE_THRESH_MEAN_C, THRESH_BINARY, 15, -2);
bitwise_not(dst3, dst3);
imshow("dst3", dst3);
//去掉 OCR(光学字符识别) 干扰线 ,比如去掉验证码图片中的干扰的线条与点(干扰的线条与点比较细,验证码比较粗的情况)
Mat chars = imread(getCVImagesPath("images/chars.png"), IMREAD_COLOR);
Mat tmp, gray_chars, bin_chars, ret;
imshow("chars", chars);
cvtColor(chars, gray_chars, COLOR_BGR2GRAY);//转化为灰度图
imshow("gray_chars", gray_chars);
adaptiveThreshold(~gray_chars, bin_chars, 255, ADAPTIVE_THRESH_MEAN_C, THRESH_BINARY, 15, -2);//转化为二值图
imshow("bin_chars", bin_chars);
Mat kernel = getStructuringElement(MORPH_RECT, Size(3, 3), Point(-1, -1));//这里Size宽高要大于干扰线与点的大小,小于验证码的大小
erode(bin_chars, tmp, kernel);
dilate(tmp, ret, kernel);//这两步就是开操作
imshow("tmp", tmp);
bitwise_not(ret, ret);//颜色反转一下,背景变成白色好看些。。
imshow("ret", ret);
waitKey(0);
}