Artikelverzeichnis
1. Laden Sie tesseract-ocr herunter und installieren Sie es
1. Herunterladen
Im Folgenden finden Sie häufig verwendete URLs zu Tesseract.
Download-Adresse: https://digi.bib.uni-mannheim.de/tesseract/Offizielle
Website: https://github.com/tesseract-ocr/tesseract
Offizielle Dokumentation: https://
Adresse des Sprachpakets github.com/tesseract-ocr/tessdoc : https://github.com/tesseract-ocr/tessdata
2. Installieren Sie tesseract-ocr
(1) Sprache auswählen
(2) Starten Sie die Installation
(3) Stimmen Sie der Lizenz zu
(4) Wählen Sie den zu installierenden Benutzer aus
(5) Wählen Sie das zu installierende Sprachpaket aus
Das Sprachpaket wird während des Installationsvorgangs automatisch vom Server heruntergeladen. (Es wird nicht empfohlen, das heruntergeladene Sprachpaket hier zu überprüfen, da die Download-Geschwindigkeit zu langsam ist. In diesem Tutorial erfahren Sie, wie Sie das Sprachpaket später erweitern. Wenn Sie die Mauer jedoch bereits umgangen haben, können Sie diesen Vorschlag ignorieren.)
Belassen Sie es einfach als Standard.
(6) Installationsort
(7) Installation starten
(8) Installation abgeschlossen
3. Sprachpaket installieren
(1) Herunterladen und installieren
https://github.com/tesseract-ocr/tessdata
Das Projekt ist groß, Sie können vereinfachtes Chinesisch bei Bedarf herunterladen:
Speichern Sie die heruntergeladenen Dateien in diesem Verzeichnis:D:\Program Files\Tesseract-OCR\tessdata
Hinweis: Wenn Sie wissenschaftlich nicht auf das Internet zugreifen können, können Sie das Sprachpaket für vereinfachtes Chinesisch hier herunterladen:https://download.csdn.net/download/A_art_xiang/88334913
(2) Testen
Geben Sie das Tesseract OCR-Installationsverzeichnis ein:
# 查看版本
PS D:\Program Files\Tesseract-OCR> .\tesseract.exe -v
tesseract v5.3.0.20221214
leptonica-1.78.0
libgif 5.1.4 : libjpeg 8d (libjpeg-turbo 1.5.3) : libpng 1.6.34 : libtiff 4.0.9 : zlib 1.2.11 : libwebp 0.6.1 : libopenjp2 2.3.0
Found AVX2
Found AVX
Found FMA
Found SSE4.1
Found libarchive 3.5.0 zlib/1.2.11 liblzma/5.2.3 bz2lib/1.0.6 liblz4/1.7.5 libzstd/1.4.5
Found libcurl/7.77.0-DEV Schannel zlib/1.2.11 zstd/1.4.5 libidn2/2.0.4 nghttp2/1.31.0
# 查看安装的语言包
PS D:\Program Files\Tesseract-OCR> .\tesseract.exe --list-langs
List of available languages in "D:\Program Files\Tesseract-OCR/tessdata/" (4):
chi_sim
chi_sim_vert
eng
osd
2. Python-Screenshot-Erkennungstext
1. Installieren Sie die erforderlichen Pakete
pip install pyautogui
pip install pytesseract
2. Texterkennung für Bildschirmaufnahmen
import pyautogui
import pytesseract
# 设置Tesseract的安装路径(如果它不在默认的系统路径中)
pytesseract.pytesseract.tesseract_cmd = 'D:/Program Files/Tesseract-OCR/tesseract.exe'
# 截取屏幕截图
screenshot = pyautogui.screenshot()
# 定义区域范围(左上角x坐标,左上角y坐标,右下角x坐标,右下角y坐标)
region = (100, 100, 300, 200)
# 从屏幕截图中使用指定区域创建一个新的图像对象
custom_screenshot = screenshot.crop(region)
# 将图像对象转换为灰度图像,以帮助提高文本识别的准确性
custom_screenshot = custom_screenshot.convert('L')
# 使用pytesseract进行文字识别
text = pytesseract.image_to_string(custom_screenshot)
# 打印识别的文本
print(text)
3. Genauigkeit
Die Genauigkeit auf Englisch ist in Ordnung, aber die Genauigkeit auf Chinesisch. . . Es ist schwer, es mit einem Wort zu beschreiben. Es sollte möglich sein, die Genauigkeit durch Training zu verbessern.
Verweise
https://blog.csdn.net/weixin_51571728/article/details/120384909