最全Tesseract-OCR引擎安装步骤！！！适用于动态爬虫处理验证码！ - 代码天地

最全Tesseract-OCR引擎安装步骤！！！适用于动态爬虫处理验证码！

其他 2020-10-26 01:21:53 阅读次数: 0

下载

需要手动安装一下Tesseract-OCR ，这是安装包下载路径：
http://digi.bib.uni-mannheim.de/tesseract/tesseract-ocr-setup-4.00.00dev.exe
下载好了随便放到你喜欢的路径下。

安装
然后就是安装了：
选择下载包
选择合适的安装路径，个人建议不要安装在C盘
点击install安装直到结束。
中间可能会报这个错，就是说安装错误了，就是说前面勾选的那两个语言包下载出问题了，不过不影响我后来的使用。
环境配置
找到你的安装路径：B:\Tesseract-OCR（我的是这个）
打开高级系统设置，配置环境变量：
用户变量：把路径加进去
系统变量：
变量名写和我一样，路径是你自己的。
另外，如果需要更多语言包可以在这个公众号里找：

这是看的别人的，如果需要就自行下载！不需要的话可以直接略过，这个东西安装好之后可以识别数字以及英文验证码，中文好像不可以！
安装python需要的包！
安装pytesseract库：

	pip install pytesseract

安装PIL库：

	pip install pillow

装好之后，来到下载那个包的文件夹下：
E:\Anaconda 2019.03\Lib\site-packages\pytesseract
（我的是这个）打开这个：
在这里插入图片描述这里，修改成你自己的，那个安装路径然后跟一个.exe文件，就在那个文件夹里，和我一样就可以。

测试：在Jupyter中输入如下代码，如能正确运行表示配置成功（注：需将’captcha.jpg’验证码图片与Jupyter文件放在同一文件夹）

import pytesseract
from PIL import Image
# 创建Image对象
image = Image.open('captcha.jpg')
# 将图片文件转化为字符串
text = pytesseract.image_to_string(image)
print(text)

在这里插入图片描述
运行成功即可提取出里面的验证码！！！

如果你成功了，记得给我点个赞哦！！！

猜你喜欢

转载自blog.csdn.net/qq_46295527/article/details/105799380

最全Tesseract-OCR引擎安装步骤！！！适用于动态爬虫处理验证码！

【tesseract-ocr】tesseract-ocr下载、安装、提取图片验证码

selenium 验证码登录之Tesseract-OCR 安装

Python爬虫教程-29-验证码识别-Tesseract-OCR

Python爬虫笔记【一】模拟用户访问之Tesseract-ocr验证码训练（5）

使用tesseract-ocr破解网站验证码

tesseract-ocr 传统验证码识别

Tesseract-ocr视觉学习-验证码识别及使用

python使用tesseract-ocr完成验证码识别

Tesseract-OCR识别图片验证码

验证码识别之Tesseract-OCR

Tesseract-OCR引擎的安装

centos7下安装tesseract-ocr进行验证码识别

Mac上tesseract-OCR 的安装配置，识别验证码

【验证码识别】Pillow、tesseract-ocr与pytesseract模块的安装以及错误解决

centos7下安装tesseract-ocr进行验证码识别,centos7 安装tesseract

破解验证码相关:用imagemagick和tesseract-ocr破解简单验证码

Python验证码识别安装Pillow、tesseract-ocr与pytesseract模块的安装以及错误解决

OpenCV---数字验证码识别 Python验证码识别安装Pillow、tesseract-ocr与pytesseract模块的安装以及错误解决

JAVA验证码识别：基于jTessBoxEditorFX和Tesseract-OCR训练样本

tesseract-ocr的字库学习步骤(训练自己的文库)，关于ocr的对图片的解析,包括tesseract的安装（史上最全）

安装tesseract-ocr

Tesseract-OCR安装

Tesseract-OCR的安装

验证码识别（转载）https://www.cnblogs.com/VseYoung/p/code.html Tesseract-OCR Tesseract-OCR pytesseract

Tesseract-OCR引擎入门

爬虫简单验证码处理，Tesseract简单使用

linux 安装Tesseract-OCR

macbook 安装tesseract－ocr

Tesseract-OCR 的安装与使用

今日推荐

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

周排行

返回指定时间格式

fopen函数中的mode参数

Java 单例模式探讨

Flex remoteobject工作原理探讨

寻找mplayer的便捷安装方法

30天了解30种技术系列---(26)MySQL自动化运维工具Inception

关于Jboss/Tomcat/Jetty的JNDI定义123

程序减肥，strip，eu-strip 及其符号表

AsyncTask、View.post(Runnable)、ViewTreeObserver三种方式总结frame animation自动启动

Json和Bean的互相转换

每日归档

更多

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)