用传统算法将较长的OCR图片分割 - 代码天地

用传统算法将较长的OCR图片分割

其他 2021-03-20 07:34:30 阅读次数: 0

1.背景介绍

在做OCR识别时，我们会遇到长度差距较大的字符串，对于太长的字符串，我们可以将图片分成多段进行识别，最后将识别结果合在一起。

2. 代码实现

思路：（1）首先将图片二值化；（2）在纵轴方向求和得出直方图分布；（3）找到切割点进行图片切割。

import cv2
import numpy as np


def split_string(img, split_num):
    """
    将图片二值化后，在纵轴方向求和

    """
    height, width, _ = img.shape
    length = int(width/split_num) - 1
    GrayImage = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
    ret, plate_binary_img = cv2.threshold(GrayImage, 0, 255, cv2.THRESH_BINARY_INV + cv2.THRESH_OTSU)
    row_histogram = np.sum(plate_binary_img, axis=0)

    index_list = []
    for index, num in enumerate(row_histogram):
        if num == 0 and row_histogram[index-1] == 0 and row_histogram[index+1] == 0:
            index_list.append(index)

    idx_list = []
    for i in range(split_num-1):
        l2 = length*(i+1)
        idx = get_idx(l2, index_list)
        idx_list.append(idx)
    idx_list.append(width-1)

    img_list = []
    for i, idx in enumerate(idx_list):
        if i == 0:
            img_list.append(img[:, :idx, :])
        else:
            img_list.append(img[:, idx_list[i-1]:idx, :])

    return img_list


def get_idx(l2, index_list):
    min_dis = 1000
    idx = 0
    for i in index_list:
        dis = abs(l2-i)
        if dis < min_dis:
            min_dis = dis
            idx = i
    return idx


if __name__ == "__main__":
    img = cv2.imread("img.jpg")
    img_list = split_string(img, 3)
    for idx, im in enumerate(img_list):
        cv2.imwrite("%s.jpg" % idx, im)

3. 效果图

原图如下：

切割后变为3条：

感兴趣的同学可以看看！

猜你喜欢

转载自blog.csdn.net/Guo_Python/article/details/110558505

用传统算法将较长的OCR图片分割

用OpenCV进行OCR字符分割

用OpenCV进行传统图像分割

用python来分割图片

Fedora 37 将弃用传统 BIOS

Excel 将数据用逗号分割

如何利用OCR文字识别软件将图片转文字

【图像分割】传统分割算法—分水岭算法（包含基于opencv的实例展示）

python用“\”来连接多行较长的语句

OCR算法

基于区域生长的图片分割算法

图像分割-传统方法

基于FCN，U-Net的深度学习医学影像分割算法（细胞分割算法）以及传统算法分析

图像文字识别(OCR)用什么算法小结

使用阿里云的图片识别成表格ocr（将图片表格转换成excel）

python-opencv 图像处理基础（十一）传统图像分割算法：分水岭算法

目标检测、OCR和语义分割等15个计算机视觉算法，82600元奖金～

将图片分割为为非重叠块

【转】Oracle用符号将字符串分割

用python 将数字每三组分割

用分割点坐标将图像二值化

用split将字符串分割并输出

将较长的名称设置显示位数，多余的展示为。。。

用R将图片转为字符画

用python将pdf转成图片

用Python将文本转为图片

用python将图片转化为logo

常见图像传统处理算法-边缘检测-分割-增强-降噪

点云数据的语义分割算法综述总结大全（传统方法+基于深度学习的方法）

图片分割

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

curl的POST请求，封装方法

8.1.1. Integer Types

Java基础 Day05(个人复习整理)

Python - Django - 中间件 process_exception

小L的试卷

【Shell编程】（函数）判断用户是否存在

python(css样式)

spring ant path 匹配原则 - 【笔记】

《JavaScript与JScript从入门到精通》(美)James.Jaworski.中译本.扫描版.pdf

Eclipse运行带参数的java程序

每日归档

更多

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)