如何使用 Python 构建简单的 OCR 搜索应用程序 使用 Python 自动对您自己的图像进行文本搜索(教程含完整源码)

光学字符识别 (OCR) 是一项流行技术,旨在将不同类型的文档转换为可编辑和可搜索的数据。

从扫描文档到文档照片,OCR 可以成为提取文本并帮助自动化数据提取过程的有效工具。Python 是最通用的语言之一,拥有各种执行 OCR 的库。

在本文中,我们将探索一个使用该easyocr库对本地图像文件执行 OCR 的 Python 脚本。

脚步

导入必要的库
使用 easyocr 设置 OCR 阅读器
在文件夹中的图像上搜索文本
使用 cli 工具设置 main 函数
现在让我们详细揭开并理解该脚本的每个部分。

1.导入必要的库

import os
from PIL import Image
import argparse
from typing import List import easyocr

该脚本首先导入必要的 Python 库。

os用于与操作系统交互,允许脚本遍历系统中的目录。
PIL(Python 图像库)用于打开、操作和保存不同的图像文件格式。
argparse用于编写用户友好的命令行界面,处理用户给出的命令。
typing促进更明确的类型提示,提高代码可读性和调试。
easyocr是允许我们高效执行 OCR 任务的库。

2.使用easyocr设置OCR阅读器

reader = easyocr.Reader(['en'])

此行创建英语的 easyocr 阅读器 ( ‘en’)。该阅读器稍后将用于识别图像中的文本。

def ocr_scan(image_path: str) -> str:
   

猜你喜欢

转载自blog.csdn.net/iCloudEnd/article/details/133479897