openCV文档图像校正之巧用cvMinAreaRect2()函数

问题
解决方案
原理探究：什么是cvMinAreaRect2()函数
总结

阅读之前注意：

本文阅读建议用时：45min
本文阅读结构如下表：

项目	下属项目	测试用例数量
问题	无	0
解决方案	无	1
原理探究：什么是cvMinAreaRect2()函数	无	1
总结	无	0

问题

对于倾斜的文档图像，我们首先需要找出倾斜角，之后旋转校正即可。
比如把下图

校正为下图
这里写图片描述

解决方案

之前我有写过系列文档图像倾斜校正的Matlab程序，思路可以借鉴。但是现在我提出来的解决方法是另外一种思路：当我们把文字经过闭运算、膨胀、腐蚀等处理后得到连成大概像一个矩形的长条。类似下图：
这里写图片描述
那么我们可以找到最长的长条。之后如果我们能够计算出长条的外接矩形的话，外接矩形的倾斜角即是图像的倾斜角！事实上，openCV给我们提供了非常方便的函数来寻找这样的矩形，使用cvMinAreaRect2()函数即可得到这个长条的外接矩形，而外接矩形的倾斜角能够直接查询到。
以下是具体代码（注意看注释）：

//主要应用了cvMinAreaRect2()函数 得到线的倾斜角
#include <iostream>  
#include <opencv2/core/core.hpp>  
#include <opencv2/highgui/highgui.hpp>  
#include <opencv2/opencv.hpp>//如果要包含所有库

using namespace cv;

//图片旋转操作 
void imrotate(Mat& src, Mat& dst, double angle)
{
    cv::Point2f center((float)src.cols / 2, (float)src.rows / 2);
    cv::Mat rot = cv::getRotationMatrix2D(center, angle, 1);
    cv::Rect bbox = cv::RotatedRect(center, src.size(), angle).boundingRect();

    rot.at<double>(0, 2) += bbox.width / 2.0 - center.x;
    rot.at<double>(1, 2) += bbox.height / 2.0 - center.y;
    cv::warpAffine(src, dst, rot, bbox.size());
}

void main()
{
    int i = 0, j = 0;
    Mat img = imread("26.bmp", 0);//读取图像img。0表示转换为灰度图像读入
    Mat saveImg = imread("26.bmp", 0);
    //imshow("savwImg", saveImg);
    if (img.empty())
    {
        printf("当前文件目录下没有那张图片\n");
        system("pause"); exit(0);
    }
    int row = img.rows;
    int col = img.cols;
    imshow("原图", img);

    //图像预处理部分--------------------------------------------------------
    threshold(img, img, 0, 255, CV_THRESH_OTSU);//最大类间方差法进行二值化处理
    img = ~img;//把img取反，变为黑色背景，白色字，便于形态学处理

    morphologyEx(img, img, MORPH_CLOSE, Mat(18, 18, CV_8U), Point(-1, -1), 1);//形态学闭操作
    dilate(img, img, Mat(12, 12, CV_8U), Point(-1, -1), 1);//膨胀
    erode(img, img, Mat(18, 18, CV_8U), Point(-1, -1), 1);//腐蚀

    Size sz;
    pyrDown(img, img, sz, BORDER_DEFAULT);//缩小图片
    pyrDown(img, img, sz, BORDER_DEFAULT);//缩小图片
    imwrite("27.png", img);

    //获取倾斜角------------------------------------------------------
    IplImage imgTmp = img;//为了方便程序运行，这里采用老版的图像数据类型
    IplImage  *src = cvCloneImage(&imgTmp);//图像数据的深拷贝
    cvShowImage("预处理后的图像", src);

    CvMemStorage* storage = cvCreateMemStorage(0);
    CvSeq* contour = NULL;//轮廓
    CvSeq* maxLenContour = NULL;//最长长条的轮廓
    int count = cvFindContours(src, storage, &contour, \
        sizeof(CvContour), CV_RETR_CCOMP, CV_CHAIN_APPROX_SIMPLE);//找出各个连通域
    CvBox2D box;//外接矩形
    CvBox2D maxLenBox;//最长长条的外接矩形
    float boxLen = 0.;//矩形的长或者宽
    for (; contour != 0; contour = contour->h_next)//找到最长的长条
    {
        box = cvMinAreaRect2(contour, 0);//调用cvMinAreaRect2()函数返回外接矩形给box
        if (boxLen < box.size.width)
        {
            boxLen = box.size.width;
            maxLenContour = contour;
            maxLenBox = box;
        }
        if (boxLen < box.size.height)
        {
            boxLen = box.size.height;
            maxLenContour = contour;
            maxLenBox = box;
        }
    }
    printf("maxBoxWidth is %f\n", maxLenBox.size.width);
    printf("maxBoxHeight is %f\n", maxLenBox.size.height);
    printf("angle is %f\n", maxLenBox.angle);

    //旋转校正-------------------------------------------------------
    Mat newImg;

    if (maxLenBox.size.width >= maxLenBox.size.height)
    {
        imrotate(saveImg, newImg, maxLenBox.angle);
        printf("rotate angle is %f\n", maxLenBox.angle);
    }
    else
    {
        imrotate(saveImg, newImg, 90 + maxLenBox.angle);
        printf("rotate angle is %f\n", 90 + maxLenBox.angle);
    }
    pyrDown(newImg, newImg, sz, BORDER_DEFAULT);//缩小图片
    pyrDown(newImg, newImg, sz, BORDER_DEFAULT);//缩小图片
    namedWindow("校正图");
    imshow("校正图", newImg);
    waitKey(100000);//等待100秒后窗口关闭
}

原理探究：什么是cvMinAreaRect2()函数

以下借鉴说明：函数cvMinAreaRect2()可以返回一个包围轮廓最小的长方形，这个长方形可以是倾斜的；请看下图8-7中的坦克，该函数的参数和cvBoundingRect()的相似。opencv的数据类型CvBox2D就是用来表述这样的长方形状的。
这里写图片描述

但是上图还有一定的错误，我们知道：在openCV中的默认坐标系是这样的，左上角是坐标原点，从原点往右是X轴正半轴，从原点往下是Y轴正半轴。而函数cvMinAreaRect2()返回的数据类型CvBox2D，其定义中的宽是图片顺时针转先碰到X轴的那条边，因此宽可能比长要大，而定义中的角度则是宽与X轴的夹角，因此角度永远是负值。
按照这样的规则，图8-7就是错误的，除了可以形象表示“长方形可以是倾斜的”就没有对的了。。。
我们知道，一张图片，要么是左倾斜（大于或小于45度），要么是右倾斜（大于或小于45度），因此我们测试以下的四副图片
这里写图片描述
得到的角度分别是-77.9度、-13.8度、-13.7度、-58.7度。

具体参考以下代码（测试图片可以从这里获取）：

#include <iostream>  
#include <opencv2/core/core.hpp>  
#include <opencv2/highgui/highgui.hpp>  
#include <opencv2/opencv.hpp>//如果要包含所有库

using namespace cv;

//图片旋转操作 
void imrotate(Mat& src, Mat& dst, double angle)
{
    cv::Point2f center((float)src.cols / 2, (float)src.rows / 2);
    cv::Mat rot = cv::getRotationMatrix2D(center, angle, 1);
    cv::Rect bbox = cv::RotatedRect(center, src.size(), angle).boundingRect();

    rot.at<double>(0, 2) += bbox.width / 2.0 - center.x;
    rot.at<double>(1, 2) += bbox.height / 2.0 - center.y;
    cv::warpAffine(src, dst, rot, bbox.size());
}

void main()
{
    Mat img = imread("rhh.bmp", 0);
    Mat saveImg = imread("rhh.bmp", 0);
    if (img.empty())
    {
        printf("当前文件目录下没有那张图片\n");
        system("pause"); exit(0);
    }
    threshold(img, img, 0, 255, CV_THRESH_OTSU);//最大类间方差法
    imshow("原图", img);

    img = ~img;

    IplImage imgTmp = img;
    IplImage  *src = cvCloneImage(&imgTmp);
    //cvShowImage("Source", src);
    CvMemStorage* storage = cvCreateMemStorage(0);
    CvSeq* contour = NULL;//轮廓
    CvSeq* maxLenContour = NULL;//最长长条的轮廓
    int count = cvFindContours(src, storage, &contour, \
        sizeof(CvContour), CV_RETR_CCOMP, CV_CHAIN_APPROX_SIMPLE);//找出各个连通域
    CvBox2D box;//外接矩形
    CvBox2D maxLenBox;//最长长条的外接矩形
    float boxLen = 0.;//矩形的长或者宽
    for (; contour != 0; contour = contour->h_next)//找到最长的长条
    {
        box = cvMinAreaRect2(contour, 0);//调用cvMinAreaRect2()函数返回外接矩形给box
        if (boxLen < box.size.width)
        {
            boxLen = box.size.width;
            maxLenContour = contour;
            maxLenBox = box;
        }
        if (boxLen < box.size.height)
        {
            boxLen = box.size.height;
            maxLenContour = contour;
            maxLenBox = box;
        }
    }
    printf("maxBoxWidth is %f\n", maxLenBox.size.width);
    printf("maxBoxHeight is %f\n", maxLenBox.size.height);
    printf("angle is %f\n", maxLenBox.angle);

    Mat newImg;
    if (maxLenBox.size.width >= maxLenBox.size.height)
    {
        imrotate(saveImg, newImg, maxLenBox.angle);
        printf("rotate angle is %f\n", maxLenBox.angle);
    }   
    else
    {
        imrotate(saveImg, newImg, 90 + maxLenBox.angle);
        printf("rotate angle is %f\n", 90 + maxLenBox.angle);
    }   
    namedWindow("校正图");
    imshow("校正图", newImg);
    waitKey(100000);
}

总结

本篇博客的核心是：弄清楚cvMinAreaRect2()函数返回的数据类型CvBox2D中的参数的定义。

友情链接1：cvBox2D和RotatedRect中返回的角度angle详解
友情链接2：opencv轮廓及点在轮廓内判断