ARCore之路-计算机视觉之边缘检测

版权声明:David Wang原创ARCore文章,仅供学习研究之用,不得用于任何商业目的,未经授权不得转载! https://blog.csdn.net/yolon3000/article/details/84074386

  边缘检测是图像处理和计算机视觉中的基本问题,边缘检测的目的是标识数字图像中变化明显的点。图像属性中的显著变化通常反映了属性的重要事件和变化,这些包括深度上的不连续、表面方向不连续、物质属性变化和场景照明变化, 边缘检测大幅度地减少了数据量,并且剔除了可以认为不相关的信息,保留了图像重要的结构属性。常用的描边也是先进行边缘然后再进行边缘处理。

一、卷积

  卷积(Convolution)本质上来讲就是一种数学运算,跟减加乘除没有区别。在图像处理中用一个模板(这个模板就是卷积核(kernel))和一幅图像进行卷积,对于图像上的一个点,让模板的原点和该点重合,然后模板上的点和图像上对应的点相乘,最后将各点的积相加,就得到该点的卷积值。然后移动模板对正下一个点,对图像上的每个点都这样处理。卷积是一种积分运算,可以看作加权求和,可以用来消除噪声、特征增强, 把一个点的像素值用它周围的点的像素值的加权平均代替。
  卷积核通常是一个四方形风格结构(如2x2、3x3),该网格区域内的每一个方格都有一个权重值。当对图像中的某个像素进行卷积时,我们会把卷积核的中心放置于该像素上,如下图所示,翻转核之后再依次计算核中每个元素和其覆盖的图像像素值的乘积,最后将各乘积累加,得到的结果就是该像素的新像素值。然后移动卷积核到下一个像素,进行同样的处理,至到所有像素都处理完。

DavidWang原创
DavidWang原创
  卷积听起来很难,在图形处理中其实就这么简单,但卷积可以实现很多常见的图像处理效果,例如图像模糊、边缘检测等等。

二、sobel算子

  卷积的神奇之处在于选择的卷积核,用于边缘检测的卷积核也叫边缘检测算子,先后有好几种边缘检测算子被提出来。

  • Roberts算子
DavidWang原创
  Roberts算子采用对角线方向相邻两像素之差近似梯度幅值检测边缘。检测水平和垂直边缘的效果好于斜向边缘,定位精度高,但对噪声敏感。
  • Prewitt算子
DavidWang原创

  Prewitt算子利用像素点上下、左右邻点灰度差,在边缘处达到极值检测边缘。对噪声具有平滑作用,但是定位精度不够高。

  • Sobel算子
DavidWang原创

  Sobel 算子主要用作边缘检测,它是一个离散的一阶差分算子,用来计算图像亮度函数的一阶梯度之近似值。在图像的任何一点使用此算子,将会产生该点对应的梯度矢量或是其法矢量。与Prewitt算子相比,Sobel算子对于像素的位置的影响做了加权,可以降低边缘模糊程度,因此效果更好。

  该算子包含两组3x3的矩阵,分别为横向及纵向,将之与图像作平面卷积,即可分别得出横向及纵向的亮度差分近似值。如果以A代表原始图像,Gx及Gy分别代表经横向及纵向边缘检测的图像灰度值,其公式如下:

DavidWang原创

  具体计算如下:

Gx = (-1)*f(x-1, y-1) + 0*f(x,y-1) + 1*f(x+1,y-1)

      +(-2)*f(x-1,y) + 0*f(x,y)+2*f(x+1,y)

      +(-1)*f(x-1,y+1) + 0*f(x,y+1) + 1*f(x+1,y+1)

     = [f(x+1,y-1)+2*f(x+1,y)+f(x+1,y+1)]-[f(x-1,y-1)+2*f(x-1,y)+f(x-1,y+1)]

 

Gy =1* f(x-1, y-1) + 2*f(x,y-1)+ 1*f(x+1,y-1)

      +0*f(x-1,y) 0*f(x,y) + 0*f(x+1,y)

      +(-1)*f(x-1,y+1) + (-2)*f(x,y+1) + (-1)*f(x+1, y+1)

     = [f(x-1,y-1) + 2f(x,y-1) + f(x+1,y-1)]-[f(x-1, y+1) + 2*f(x,y+1)+f(x+1,y+1)]

  其中f(a,b), 表示图像(a,b)点的灰度值;
  图像的每一个像素的横向及纵向灰度值通过以下公式结合,来计算该点灰度的大小:

   G = G x 2 + G y 2 G=\sqrt{Gx^2+Gy^2}

  通常,为了提高效率 使用不开平方的近似值:

   G = G x + G y G=|Gx|+|Gy|

  如果梯度G大于某一阀值则认为该点(x,y)为边缘点。Sobel算子根据像素点上下、左右邻点灰度加权差,在边缘处达到极值这一现象检测边缘。对噪声具有平滑作用,提供较为精确的边缘方向信息,边缘定位精度不够高。当对精度要求不是很高时,是一种较为常用的边缘检测方法。

  Sobel算子的计算速度比Roberts算子慢,但其较大的卷积核在很大程度上平滑了输入图像,使算子对噪声的敏感性降低。与Roberts算子相比,通常也会为相似的边缘产生更高的输出值。与Roberts算子一样,操作时输出值很容易溢出仅支持小整数像素值(例如8位整数图像)的图像类型的最大允许像素值。当发生这种情况时,标准做法是简单地将溢出的输出像素设置为最大允许值。通过使用支持范围更大的像素值的图像类型,可以避免此问题。

三、ARCore计算机视觉示例

  打开ARCore SDK自带的Computer vision示例。

DavidWang原创
  在Hierarchy窗口中选中ComputerVisionController,在Inspector窗口中双击编辑ComputerVisionController.cs脚本。先不管其他辅助操作的功能如获取摄像头图像、显示信息等,我们直接查看EdgeDetector.Detect()方法,这里采用的边缘检测就是使用的Sobel算子卷积。
       private static void Sobel(byte[] outputImage, IntPtr inputImage, int width, int height, int rowStride)
        {
            // Adjust buffer size if necessary.
            int bufferSize = rowStride * height;
            if (bufferSize != s_ImageBufferSize || s_ImageBuffer.Length == 0)
            {
                s_ImageBufferSize = bufferSize;
                s_ImageBuffer = new byte[bufferSize];
            }

            // Move raw data into managed buffer.
            System.Runtime.InteropServices.Marshal.Copy(inputImage, s_ImageBuffer, 0, bufferSize);

            // 边缘检测的阈值
            int threshold = 128 * 128;
            
            for (int j = 1; j < height - 1; j++)
            {
                for (int i = 1; i < width - 1; i++)
                {
                    // Offset of the pixel at [i, j] of the input image.
                    int offset = (j * rowStride) + i;

                    // Neighbour pixels around the pixel at [i, j].
                    int a00 = s_ImageBuffer[offset - rowStride - 1];
                    int a01 = s_ImageBuffer[offset - rowStride];
                    int a02 = s_ImageBuffer[offset - rowStride + 1];
                    int a10 = s_ImageBuffer[offset - 1];
                    int a12 = s_ImageBuffer[offset + 1];
                    int a20 = s_ImageBuffer[offset + rowStride - 1];
                    int a21 = s_ImageBuffer[offset + rowStride];
                    int a22 = s_ImageBuffer[offset + rowStride + 1];

                    int xSum = -a00 - (2 * a10) - a20 + a02 + (2 * a12) + a22;
                    int ySum = a00 + (2 * a01) + a02 - a20 - (2 * a21) - a22;
                    
                    if ((xSum * xSum) + (ySum * ySum) > threshold)
                    {
                        outputImage[(j * width) + i] = 0xFF;  //是边缘则输出纯白
                    }
                    else
                    {
                        outputImage[(j * width) + i] = 0x1F;  //不是边缘则输出黑色
                    }
                }
            }
        }

  通过之前的讲解,我们应该很容易理解这段代码,使用sobel算子做边缘检测的效果如下图所示:

DavidWang原创

猜你喜欢

转载自blog.csdn.net/yolon3000/article/details/84074386