OCR-字体颜色与背景颜色区分不明显的调研 - 代码天地

OCR-字体颜色与背景颜色区分不明显的调研

企业开发 2023-04-07 17:06:00 阅读次数: 0

需解决的问题

对于一些图片，字体和颜色区分度不高（白色字体的图片进行图像增强时容易使字体更加），模型识别时存在漏检现象，图像增强后有些文字将会变得不清晰甚至消失。

解决的方法——图像的二值化

以下使用了七种方法进行测试

Python代码：

import cv2

thresh_value = 127

img = cv2.imread(r'C:\Users\Ruidada\Desktop\color\mix.png',0)
method = [cv2.THRESH_BINARY,cv2.THRESH_BINARY_INV,cv2.THRESH_TRUNC,cv2.THRESH_TOZERO,cv2.THRESH_TOZERO_INV]

images = []
for i in range(len(method)):
    ret, thresh = cv2.threshold(img, thresh_value, 255, method[i])
    cv2.imwrite(r'C:\Users\Ruidada\Desktop\color\%d.jpg'%(i),thresh)
# 下面两图结果差不多，比上面结果好很多（除了第四种）
ret,result = cv2.threshold(img, 0, 255, cv2.THRESH_BINARY+cv2.THRESH_OTSU)
cv2.imwrite(r'C:\Users\Ruidada\Desktop\color\9.1.jpg',result)
kernel = cv2.getStructuringElement(cv2.MORPH_CROSS, (1, 1))
result = cv2.dilate(result, kernel)
result = cv2.dilate(result, kernel)

cv2.imwrite(r'C:\Users\Ruidada\Desktop\color\9.2.jpg',result)

原图

二值化后：

从七个结果反馈可以看出第四种方法效果是最好的，几乎没有出现内容缺失或是不清晰的情况，最后两个方法效果差一些，存在内容缺失的情况，但是字体更加的明显。

后续的一些猜想改进：或可以将原本是白色字体的转化成黑色字体，这样或许进行图像增强将不会出现内容不清晰或是缺失的现象，二值化后字体或许能更加的清晰（还得继续......）。

猜你喜欢

转载自blog.csdn.net/Rick_rui/article/details/127782292

OCR-字体颜色与背景颜色区分不明显的调研

OCR -- 生成与背景有差异字体颜色

OCR测试——字体和背景颜色

电脑开机后所有程序颜色变淡、泛白、浏览器打开网页部分元素底色近乎消失、边框边界不明显解决办法

Spinner背景、字体颜色

Codeblocks的背景颜色及字体

html颜色（背景，字体等）

idea窗口下方滚动条不明显设置

HDR效果不明显处理 MTK平台

设置eclipse背景颜色和字体颜色

设置WebView字体颜色，背景颜色

codeblocks修改字体颜色-背景颜色

配置SecureCRT背景颜色和字体颜色

JAVA字体颜色背景颜色设置

字体背景颜色的高度修改

聚焦改变字体，背景颜色

批处理字体及背景颜色

eclipse设置字体及背景颜色

eclipse 更改背景颜色字体

qtabwidget表头字体大小、字体颜色、背景颜色设置

eclipse如何修改背景颜色、字体颜色、字体大小

设置UITableView Section的背景颜色和字体颜色

ListView的Item选中改变TextView字体颜色，背景颜色

MFC 修改各种控件的背景颜色、字颜色和字体

状态栏背景颜色以及字体颜色的更改

设置div中的背景颜色及div中的字体颜色

EXT.NET GridPanel 设置 CELL 背景颜色字体颜色

改变input框disabled 属性的背景颜色以及字体颜色

CSS给button添加背景颜色并给button中字体也添加颜色

RadioGroup 的 RadioButton 选择改变字体颜色和背景颜色

今日推荐

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

周排行

static方法和非static方法的区别（java）

如何查找计算机专业paper

java.lang.ClassFormatError: Incompatible magic value 0 in class file com/sitecha

跳跃游戏II

stm32_之【建立工程】

TeaWeb v0.0.9 发布，统计底层优化、主机监控功能改进

事件分发 -----控制字体大小

JavaScript DOM练习（动态表格添加） December 25，2019

JSF Scope & CDI

实现从零搭建一个登录注册页面（附源代码）

每日归档

更多

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)