opencv学习——OCR字符识别特征提取 - 代码天地

opencv学习——OCR字符识别特征提取

其他 2019-01-16 11:10:55 阅读次数: 0

版权声明：本文为博主原创文章，未经博主允许不得转载。 https://blog.csdn.net/kwame211/article/details/86502282

方法：可选用水平累积直方图、垂直累积直方图特征以及低分辨图像作为特征，用于训练的输入层

图中低分辨率图像的像素为5*5

1、水平和垂直累积直方图

a、使用countNonZero函数计算每一行或每一列的非0像素数，存放在矩阵mhist中

b、使用minMaxLoc函数求出mhist中的最大值

c、使用convertTo函数将mhist中所有的元素都除以这个最大值

Mat ProjectedHistogram(Mat img, int t)
{
int sz=(t)?img.rows:img.cols;
Mat mhist=Mat::zeros(1,sz,CV_32F);

for(int j=0; j<sz; j++){
Mat data=(t)?img.row(j):img.col(j);
mhist.at<float>(j)=countNonZero(data);
}

//Normalize histogram
double min, max;
minMaxLoc(mhist, &min, &max);

if(max>0)
mhist.convertTo(mhist,-1 , 1.0f/max, 0);

return mhist;
}
2、特征提取

mhist的所有元素+vhist的所有元素+低分辨率图像的所有像素

低分辨率图像可以是5*5，10*10，15*15，20*20，需要训练和测试来确定哪个最适合

Mat features(Mat in, int sizeData){
//Histogram features
Mat vhist=ProjectedHistogram(in,VERTICAL);
Mat hhist=ProjectedHistogram(in,HORIZONTAL);

//Low data feature
Mat lowData;
resize(in, lowData, Size(sizeData, sizeData) );

if(DEBUG)
drawVisualFeatures(in, hhist, vhist, lowData);


//Last 10 is the number of moments components
int numCols=vhist.cols+hhist.cols+lowData.cols*lowData.cols;

Mat out=Mat::zeros(1,numCols,CV_32F);
//Asign values to feature
int j=0;
for(int i=0; i<vhist.cols; i++)
{
out.at<float>(j)=vhist.at<float>(i);
j++;
}
for(int i=0; i<hhist.cols; i++)
{
out.at<float>(j)=hhist.at<float>(i);
j++;
}
for(int x=0; x<lowData.cols; x++)
{
for(int y=0; y<lowData.rows; y++){
out.at<float>(j)=(float)lowData.at<unsigned char>(x,y);
j++;
}
}
if(DEBUG)
cout << out << "\n===========================================\n";
return out;
}
这样，通过features函数可提取出每一个训练样本的特征F_NUM，作为ANN的输入层

Mat layerSizes = (Mat_<int>(1, 3) << F_NUM, Hidden_NUM, classSum);

猜你喜欢

转载自blog.csdn.net/kwame211/article/details/86502282

opencv学习——OCR字符识别特征提取

OpenCV+OCR 图像处理字符识别原理及代码

Python，OpenCV中的光学字符识别OCR文章汇总

Halcon转OpenCV实例--OCR字符识别(附源码)

Python+OpenCV+Tesseract实现OCR字符识别

OpenCV C++ 图像处理实战 ——《OCR字符识别》

opencv 特征提取

OpenCV特征提取

OpenCV~特征提取

Opencv特征提取与检测学习02

Opencv特征提取与检测学习01

Opencv学习笔记——特征提取

OCR字符识别检测

光学字符识别OCR

OCR光学字符识别

Halcon OCR字符识别

opencv的svm学习_字符识别

【opencv】LBP特征提取

opencv 特征提取综述

图像特征提取 by OpenCV

人民币字符识别——opencv和开源ocr模型两种方式识别

OpenCV 中的字符识别

光学字符识别OCR-2

光学字符识别OCR-3

光学字符识别OCR-4

OCR技术（光学字符识别）

【源码】光学字符识别（OCR）仿真

OCR （光学字符识别技术）安装

OCR字符识别效果测试

用Transformer实现OCR字符识别！

今日推荐

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

周排行

计算机组成与设计（七）—— 除法器

Integer Approximation(分治+枚举)

大话数据库索引

windows10系统JDK的配置及下载地址

mysql实现秒值转换中原六仔平台搭建

Codeforces Round #556 (Div. 1)

百练1064 网线主管

Codeforces 995F Cowmpany Cowmpensation

子集生成之增量构造法，位向量法，二进制法

ERROR: cmd.exe failed with args /c "/APK\gradle\rungradle.bat...

每日归档

更多

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)