opencv学习笔记--图像金字塔


图像金字塔
  • 一个图像金字塔是一系列图像的集合 - 所有图像来源于同一张原始图像 - 通过梯次向下采样获得,直到达到某个终止条件才停止采样。
  • 有两种类型的图像金字塔常常出现在文献和应用中:
    • 高斯金字塔(Gaussian pyramid): 用来向下采样
    • 拉普拉斯金字塔(Laplacian pyramid): 用来从金字塔低层图像重建上层未采样图像
  • 在这篇文档中我们将使用 高斯金字塔 。

  • 想想金字塔为一层一层的图像,层级越高,图像越小。

    Pyramid figure
  • 每一层都按从下到上的次序编号, 层级 (i+1) (表示为 G_{i+1} 尺寸小于层级 i (G_{i}))。

  • 为了获取层级为 (i+1) 的金字塔图像,我们采用如下方法:

    • 将 G_{i} 与高斯内核卷积:

      \frac{1}{16} \begin{bmatrix} 1 & 4 & 6 & 4 & 1  \\ 4 & 16 & 24 & 16 & 4  \\ 6 & 24 & 36 & 24 & 6  \\ 4 & 16 & 24 & 16 & 4  \\ 1 & 4 & 6 & 4 & 1 \end{bmatrix}

    • 将所有偶数行和列去除。

  • 显而易见,结果图像只有原图的四分之一。通过对输入图像 G_{0} (原始图像) 不停迭代以上步骤就会得到整个金字塔。

  • 以上过程描述了对图像的向下采样,如果将图像变大呢?:

    • 首先,将图像在每个方向扩大为原来的两倍,新增的行和列以0填充(0)
    • 使用先前同样的内核(乘以4)与放大后的图像卷积,获得 “新增像素” 的近似值。
  • 这两个步骤(向下和向上采样) 分别通过OpenCV函数 pyrUp 和 pyrDown 实现, 我们将会在下面的示例中演示如何使用这两个函数。

//! smooths and downsamples the image
CV_EXPORTS_W void pyrDown( InputArray src, OutputArray dst,
                           const Size& dstsize=Size(), int borderType=BORDER_DEFAULT );


//! upsamples and smoothes the image
CV_EXPORTS_W void pyrUp( InputArray src, OutputArray dst,
                         const Size& dstsize=Size(), int borderType=BORDER_DEFAULT );

两函数原型如上 src为原图像 dst为处理后图像 dstSize 为处理后图像大小 应注意其值比为2的幂 否则出错
使用中应该注意在放大操作中应使之后的图像尺寸为原尺寸四倍。缩小应为原尺寸四分之一

猜你喜欢

转载自blog.csdn.net/x670127565/article/details/74900736