Python+Tesseract OCR realisiert die Texterkennung in Screenshots

1. Laden Sie tesseract-ocr herunter und installieren Sie es

1. Herunterladen

Im Folgenden finden Sie häufig verwendete URLs zu Tesseract.
Download-Adresse: https://digi.bib.uni-mannheim.de/tesseract/Offizielle
Website: https://github.com/tesseract-ocr/tesseract
Offizielle Dokumentation: https://
Adresse des Sprachpakets github.com/tesseract-ocr/tessdoc : https://github.com/tesseract-ocr/tessdata

Fügen Sie hier eine Bildbeschreibung ein

2. Installieren Sie tesseract-ocr

(1) Sprache auswählen

Fügen Sie hier eine Bildbeschreibung ein

(2) Starten Sie die Installation

Fügen Sie hier eine Bildbeschreibung ein

(3) Stimmen Sie der Lizenz zu

Fügen Sie hier eine Bildbeschreibung ein

(4) Wählen Sie den zu installierenden Benutzer aus

Fügen Sie hier eine Bildbeschreibung ein

(5) Wählen Sie das zu installierende Sprachpaket aus

Das Sprachpaket wird während des Installationsvorgangs automatisch vom Server heruntergeladen. (Es wird nicht empfohlen, das heruntergeladene Sprachpaket hier zu überprüfen, da die Download-Geschwindigkeit zu langsam ist. In diesem Tutorial erfahren Sie, wie Sie das Sprachpaket später erweitern. Wenn Sie die Mauer jedoch bereits umgangen haben, können Sie diesen Vorschlag ignorieren.)

Belassen Sie es einfach als Standard.
Fügen Sie hier eine Bildbeschreibung ein

(6) Installationsort

Fügen Sie hier eine Bildbeschreibung ein

(7) Installation starten

Fügen Sie hier eine Bildbeschreibung ein

(8) Installation abgeschlossen

3. Sprachpaket installieren

(1) Herunterladen und installieren

https://github.com/tesseract-ocr/tessdata

Das Projekt ist groß, Sie können vereinfachtes Chinesisch bei Bedarf herunterladen:

Fügen Sie hier eine Bildbeschreibung ein
Speichern Sie die heruntergeladenen Dateien in diesem Verzeichnis:D:\Program Files\Tesseract-OCR\tessdata

Fügen Sie hier eine Bildbeschreibung ein
Hinweis: Wenn Sie wissenschaftlich nicht auf das Internet zugreifen können, können Sie das Sprachpaket für vereinfachtes Chinesisch hier herunterladen:https://download.csdn.net/download/A_art_xiang/88334913

(2) Testen

Geben Sie das Tesseract OCR-Installationsverzeichnis ein:

# 查看版本
PS D:\Program Files\Tesseract-OCR> .\tesseract.exe -v
tesseract v5.3.0.20221214
 leptonica-1.78.0
  libgif 5.1.4 : libjpeg 8d (libjpeg-turbo 1.5.3) : libpng 1.6.34 : libtiff 4.0.9 : zlib 1.2.11 : libwebp 0.6.1 : libopenjp2 2.3.0
 Found AVX2
 Found AVX
 Found FMA
 Found SSE4.1
 Found libarchive 3.5.0 zlib/1.2.11 liblzma/5.2.3 bz2lib/1.0.6 liblz4/1.7.5 libzstd/1.4.5
 Found libcurl/7.77.0-DEV Schannel zlib/1.2.11 zstd/1.4.5 libidn2/2.0.4 nghttp2/1.31.0
# 查看安装的语言包
PS D:\Program Files\Tesseract-OCR> .\tesseract.exe --list-langs
List of available languages in "D:\Program Files\Tesseract-OCR/tessdata/" (4):
chi_sim
chi_sim_vert
eng
osd

2. Python-Screenshot-Erkennungstext

1. Installieren Sie die erforderlichen Pakete

pip install pyautogui
pip install pytesseract

2. Texterkennung für Bildschirmaufnahmen

import pyautogui
import pytesseract

# 设置Tesseract的安装路径(如果它不在默认的系统路径中)
pytesseract.pytesseract.tesseract_cmd = 'D:/Program Files/Tesseract-OCR/tesseract.exe'

# 截取屏幕截图
screenshot = pyautogui.screenshot()

# 定义区域范围(左上角x坐标,左上角y坐标,右下角x坐标,右下角y坐标)
region = (100, 100, 300, 200)

# 从屏幕截图中使用指定区域创建一个新的图像对象
custom_screenshot = screenshot.crop(region)

# 将图像对象转换为灰度图像,以帮助提高文本识别的准确性
custom_screenshot = custom_screenshot.convert('L')

# 使用pytesseract进行文字识别
text = pytesseract.image_to_string(custom_screenshot)

# 打印识别的文本
print(text)

3. Genauigkeit

Die Genauigkeit auf Englisch ist in Ordnung, aber die Genauigkeit auf Chinesisch. . . Es ist schwer, es mit einem Wort zu beschreiben. Es sollte möglich sein, die Genauigkeit durch Training zu verbessern.

Verweise

https://blog.csdn.net/weixin_51571728/article/details/120384909

Acho que você gosta

Origin blog.csdn.net/A_art_xiang/article/details/132848802
Recomendado
Clasificación