- 畳み込みアプリケーション-画像エッジ抽出
- エッジ:ピクセル値が遷移する場所です
- エッジをキャプチャする方法:画像ピクセルの一次導関数を見つけます。明らかにここにf(x、y)があり、xの偏導関数を見つけます。偏導関数が大きいほど、X軸方向のピクセルの変化が大きくなります。 、エッジの可能性が強い
- Sobel演算子:これは離散微分演算子であり、画像のグレーレベルのおおよその勾配を計算するために使用され、1次微分演算子です。
- Sobel演算子は、ガウス平滑化と微分導関数のコレクションを備えています。Sobel演算子を使用すると、導関数を見つけるために高い数値の方法を使用する必要がありません。
- Aは元の画像であり、Gx&Gyは、XとYの2方向のピクセル導関数を含む画像を表します。計算方法は、2つの画像の対応するピクセルを乗算し、それらを合計することです。
- GxとGyを取得したら、GxとGyをグラフGxyに混合する必要があります。
- 理論:
- 練習:
- Sobelは高精度を必要としません
- Sobel演算子は、ガウス平滑化と微分導関数のコレクションを備えています。Sobel演算子を使用すると、導関数を見つけるために高い数値の方法を使用する必要がありません。
- API
- Sobel(src、dst、depth、dx、dy、kernelSize、scale、delta、borderType)
- パラメータ:ソース画像、出力画像、深度、x微分次数、y微分次数、ソーベル演算子次元、1、3、5、7、スケール、デルタ、エッジ処理タイプ
- 絶対値convertScaleAbs(A、B)を計算し、Aを計算して、Bに出力します。
- ガウスぼかし-灰色に変わる-ソーベル演算子の導出-XY構成
- GaussianBlurは小さなノイズを除去するためのものであるため、GaussianBlurのfilter \ kernelは大きすぎる必要はなく、3 * 3で問題ありません。
- Sobelはグレー値用であるため、グレーになります
#include "pch.h"
#include <iostream>
#include <opencv2/opencv.hpp>
#include <string>
using namespace std;
using namespace cv;
int main(int argc, char ** argv)
{
Mat src, gray, bin, dst;
src = imread("C:\\Users\\xujin\\Desktop\\test1.JPG");
if (!src.data)
{
cout << "no image";
return -1;
}
namedWindow("src_image", WINDOW_AUTOSIZE);
namedWindow("dst_image", WINDOW_AUTOSIZE);
imshow("src_image", src);
GaussianBlur(src, dst, Size(3, 3), 0, 0);
Mat dst_gray;
cvtColor(dst, dst_gray, CV_BGR2GRAY);
imshow("dst__gray_image", dst_gray);
Mat xgrad, ygrad;
//同样可使用Scharr算子,即Sobel算子的升级版
Scharr(dst_gray, xgrad, CV_16S, 1, 0, 3);
Scharr(dst_gray, ygrad, CV_16S, 0, 1, 3);
//Sobel(dst_gray, xgrad, CV_16S, 1, 0, 3);
//Sobel(dst_gray, ygrad, CV_16S, 0, 1, 3);
convertScaleAbs(xgrad, xgrad);
convertScaleAbs(ygrad, ygrad); //Abs绝对值
imshow("xgrad", xgrad);
imshow("ygrad", ygrad);
imshow("dst_image", dst);
Mat dst_xygrad;
//XY梯度混合
//addWeighted(xgrad, 0.5, ygrad, 0.5, 0, dst_xygrad);
//不适用API来实现
dst_xygrad = Mat(xgrad.size(), xgrad.type());
int width = dst_xygrad.cols;
int height = dst_xygrad.rows;
for (int row = 0; row < height; row++)
{
for (int col = 0; col < width; col++)
{
int xg = xgrad.at<uchar>(row, col);
int yg = ygrad.at<uchar>(row, col);
int xy = xg + yg;
dst_xygrad.at<uchar>(row, col) = saturate_cast<uchar>(xy);
}
}
imshow("dst_XYimage", dst_xygrad);
waitKey(0);
return 0;
}
- ラップランス演算子
- 二次導関数の場合、一次導関数のピーク点は二次導関数0に対応し、エッジピクセル位置は二次導関数0に従って抽出されます。
- Laplacian()関数は、Sobel演算子によって取得されたxおよびy方向の導関数を加算することによってラプラス変換の結果を取得するため、導関数を個別に見つけて加算する必要はありません。
- API
- ラプラシアン(src、dst、depth、ksize、scale、delta、borderType)
- パラメータ:ソース画像、ターゲット画像、画像の深さ、カーネルサイズ、スケールファクター、デルタ、境界タイプ
- 二次導関数の場合、一次導関数のピーク点は二次導関数0に対応し、エッジピクセル位置は二次導関数0に従って抽出されます。
#include "pch.h"
#include <iostream>
#include <opencv2/opencv.hpp>
#include <string>
using namespace std;
using namespace cv;
int main(int argc, char ** argv)
{
Mat src, gray, bin, dst;
src = imread("C:\\Users\\xujin\\Desktop\\test1.JPG");
if (!src.data)
{
cout << "no image";
return -1;
}
namedWindow("src_image", WINDOW_AUTOSIZE);
namedWindow("dst_image", WINDOW_AUTOSIZE);
imshow("src_image", src);
GaussianBlur(src, dst, Size(3, 3), 0, 0);
imshow("dst_image", dst);
Mat dst_gray;
cvtColor(dst, dst_gray, CV_BGR2GRAY);
namedWindow("dstGray_image", WINDOW_AUTOSIZE);
imshow("dstGray_image", dst_gray);
Mat dstGray, edgImage;
GaussianBlur(src, dst, Size(3, 3), 0, 0);
cvtColor(dst, dstGray, COLOR_BGR2GRAY);
Laplacian(dstGray, edgImage, CV_16S, 3);
convertScaleAbs(edgImage, edgImage);
namedWindow("Lap_image", WINDOW_AUTOSIZE);
imshow("Lap_image", edgImage);
waitKey(0);
return 0;
}