python+Tesseract-OCR实现图片识别(只适合新手)

1.首先准备环境:

python版本:2.7/3.6

操作系统:windows系统

2.准备工具:

tesseract-ocr 安装后设置好环境变量

链接: https://pan.baidu.com/s/1j8lBbQBrrbPaHAn5ujWFSw 提取码: 2med 

Pycharm

3.安装相关python包(作者使用的是py3.6)

pip install Pillow

pip install pytesseract

4.使tesseract-ocr与python关联,从而使python能够调用Tesseract-OCR程序识别验证码/文字:

修改pytesseract.py文件中第35行将tesseract_cmd指向Tesseract-OCR的tesseract.exe
我的是

# CHANGE THIS IF TESSERACT IS NOT IN YOUR PATH, OR IS NAMED DIFFERENTLY

tesseract_cmd = 'D:/Tesseract/Tesseract-OCR/tesseract.exe'

5.pycharm中程序运行

from PIL import Image
import pytesseract
image = Image.open('1.png')#输入自己想识别图片的路径
# 指定路径,路径为安装的OCR对应的目录
text = pytesseract.image_to_string(image,) #如果安装了中文包逗号后可加参数 lang='chi_sim',
print(text)

注意图片为当前目录

完成!

猜你喜欢

转载自blog.csdn.net/qq_41856814/article/details/89921622