文字背景有纹理情况下的预处理 - 代码天地

文字背景有纹理情况下的预处理

其他 2020-10-03 18:36:54 阅读次数: 0

很多时候纹理很影响识别效果，所以偶尔需要预处理一下，毕竟纹理的样本不好生成啊，样本不够训练的效果不好，只能这样了。

主要思路就是：去除表格----去纹理----聚类招文字----提取文字区域生成结果

    result = cv2.bilateralFilter(result, 5, 75, 75)
    #聚类提取浅色文字
    criteria = (cv2.TERM_CRITERIA_EPS + cv2.TERM_CRITERIA_MAX_ITER, 10, 1.0)
    flags = cv2.KMEANS_RANDOM_CENTERS

    img = result.reshape((-1,1))
    img = np.float32(img)
    ompactness,labels,centers = cv2.kmeans(img,3,None,criteria,10, flags)

    thresh_num = (centers[2]+centers[1])/2
    #根据聚类结果进行阈值化
    _,new = cv2.threshold(result, thresh_num, 255, cv2.THRESH_TOZERO_INV)
    new = cv2.bitwise_not(new)

    _,new = cv2.threshold(new, thresh_num, 255, cv2.THRESH_BINARY)
    #腐蚀膨胀并提取roi
    kernel = np.ones((3,3),np.uint8)
    new_erode = cv2.erode(new,kernel,iterations = 1)
    new = cv2.bitwise_not(new_erode)
    roi = np.uint8(np.full(result.shape,255))
    backimage = cv2.bitwise_and(roi, result, mask=new)
    roi = np.uint8(np.full(result.shape,255))
    backimage = cv2.bitwise_or(new_erode, backimage)

以上不包含表格去除的步骤，只包含后三部分。识别率的提升还是很可观的～～

猜你喜欢

转载自blog.csdn.net/wi162yyxq/article/details/103701282

文字背景有纹理情况下的预处理

没有Form的情况下，关于AJax异步上传文件处理

css - 高度不定的情况下，让文字水平居中

高并发情况下的redis链接处理

kafka的consumer消费能力很低的情况下的处理方案

mysql在生产环境下有大量锁表,又不允许重启的情况下的处理办法

关于如何处理大屏head盒子和body盒子在同背景色值情况下如和进行区分

AlertDailog在没有Activity依附的情况下，如何显示

有return的情况下try catch finally的执行顺序

没有root权限的情况下安装memcached

在没有权限的情况下添加系统变量

在没有x的情况下配置网络

没有电流设备的情况下的App电量测试

在没有父POM的情况下使用Spring Boot

没有外网的情况下更新Android SDK Manager

在有外网的情况下安装docker

有登录验证的情况下，做接口请求

有复选框情况下，sql拼写技巧

【Linux】没有网的情况下如何安装GCC

有继承情况下的初始化

有登陆认证的情况下使用RESTClient

在有宝塔面板的情况下实现ip访问

IDEA SpringBoot 从零搭建(有网络情况下)

如何在没有头衔的情况下领导

xshell在没有xftp的情况下很方便的上传

宽松等于的情况下，有布尔值的情况需要注意的地方

linux下安装python3（已有python2.x情况下）

单例下并发的情况下访问私有变量的一个典型问题

单例下并发的情况下访问私有变量的一个典型问题

在比特币利好的情况下，莱特币有没有投资价值？

今日推荐

Linus “吃狗粮”最积极！

开源日报 | Winamp播放器即将开源；生成式AI之战升级第二轮；Linus“吃狗粮”最积极；AI进入泡沫前期；吴泳铭为阿里云带来了什么？

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

周排行

LogN级别的区间查询算法(线段树), 你学会了吗

数论概论(英文版.第4版)

idea 更新后和新的直接安装前，都需要配置 idea64.exe.vmoptions 后再使用

CANOpen系列教程04_CAN总线波特率、位时序、帧类型及格式说明

Java序列化基础

java排序算法整理

异常：org.apache.ibatis.reflection.ReflectionException

（算法练习）——二路归并排序

go 闭包函数

好程序员web前端技术分享媒体查询

每日归档

更多

2024-05-21(8)

2024-05-20(36)

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)