最も完全なTesseract-OCRエンジンのインストール手順!!!動的クローラー処理検証コードに適しています!

  1. ダウンロード

Tesseract-OCRを手動でインストールする必要があります。これはインストールパッケージのダウンロードパスです:
http//digi.bib.uni-mannheim.de/tesseract/tesseract-ocr-setup-4.00.00dev.exe、
ダウンロードして好きなように配置しますパスの下。

  1. インストールが
    続いてインストールされています:
    ここに写真の説明を挿入ここに写真の説明を挿入ここに写真の説明を挿入ダウンロードパッケージを選択し、
    ここに写真の説明を挿入適切なインストールパスを選択し、私は個人的にCドライブにインストールし、しないことをお勧めします。
    ここに写真の説明を挿入最後までインストール]をクリックします。
    ここに写真の説明を挿入このエラーは途中で報告される場合があります。これは、インストールが間違っていることを意味します。つまり、以前にチェックした2つの言語パックのダウンロードに問題がありますが、その後の使用には影響しません。
    ここに写真の説明を挿入

  2. 環境構成
    インストールパスを見つけます:B:\ Tesseract-OCR(私のものはこれです)、
    高度なシステム設定を開き、環境変数を構成します:
    ユーザー変数:システム変数にここに写真の説明を挿入パスを追加し
    ここに写真の説明を挿入ます:
    ここに写真の説明を挿入私と同じ変数名を書きます、パスはあなた自身ですの。
    ここに写真の説明を挿入さらに、さらに言語パックが必要な場合は、この公式
    ここに写真の説明を挿入
    アカウントで見つけることができますこれは他の人のものです。必要に応じて自分でダウンロードしてください。不要な場合は直接スキップできます。インストールは数字や英語の確認コードは認識できますが、中国語は認識できないようです!
    ここに写真の説明を挿入

  3. pythonに必要なパッケージをインストールしてください!
    pytesseractライブラリをインストールします。

	pip install pytesseract

PILライブラリをインストールします。

	pip install pillow

インストール後、パッケージをダウンロードしたフォルダーに移動します
。E:\ Anaconda 2019.03 \ Lib \ site-packages \ pytesseract
(私のものはこれです)これを開きます:
ここに写真の説明を挿入ここで、独自のインストールパスに変更し、次の手順に従います。私と同じように、.exeファイルはそのフォルダーにあります。
ここに写真の説明を挿入

  1. テスト:Jupyterに次のコードを入力します。正しく実行できる場合、構成は成功しています(注:「captcha.jpg」検証コードイメージとJupyterファイルを同じフォルダーに配置する必要があります)
import pytesseract
from PIL import Image
# 创建Image对象
image = Image.open('captcha.jpg')
# 将图片文件转化为字符串
text = pytesseract.image_to_string(image)
print(text)

ここに写真の説明を挿入
正常に動作した後、内部の確認コードを抽出できます!

あなたが成功した場合、私にいいねを与えることを忘れないでください!

おすすめ

転載: blog.csdn.net/qq_46295527/article/details/105799380