- ダウンロード
Tesseract-OCRを手動でインストールする必要があります。これはインストールパッケージのダウンロードパスです:
http://digi.bib.uni-mannheim.de/tesseract/tesseract-ocr-setup-4.00.00dev.exe、
ダウンロードして好きなように配置しますパスの下。
-
インストールが
続いてインストールされています:
ダウンロードパッケージを選択し、
適切なインストールパスを選択し、私は個人的にCドライブにインストールし、しないことをお勧めします。
最後までインストール]をクリックします。
このエラーは途中で報告される場合があります。これは、インストールが間違っていることを意味します。つまり、以前にチェックした2つの言語パックのダウンロードに問題がありますが、その後の使用には影響しません。
-
環境構成
インストールパスを見つけます:B:\ Tesseract-OCR(私のものはこれです)、
高度なシステム設定を開き、環境変数を構成します:
ユーザー変数:システム変数にパスを追加し
ます:
私と同じ変数名を書きます、パスはあなた自身ですの。
さらに、さらに言語パックが必要な場合は、この公式
アカウントで見つけることができます。これは他の人のものです。必要に応じて自分でダウンロードしてください。不要な場合は直接スキップできます。インストール後は数字や英語の確認コードは認識できますが、中国語は認識できないようです!
-
pythonに必要なパッケージをインストールしてください!
pytesseractライブラリをインストールします。
pip install pytesseract
PILライブラリをインストールします。
pip install pillow
インストール後、パッケージをダウンロードしたフォルダーに移動します
。E:\ Anaconda 2019.03 \ Lib \ site-packages \ pytesseract
(私のものはこれです)これを開きます:
ここで、独自のインストールパスに変更し、次の手順に従います。私と同じように、.exeファイルはそのフォルダーにあります。
- テスト:Jupyterに次のコードを入力します。正しく実行できる場合、構成は成功しています(注:「captcha.jpg」検証コードイメージとJupyterファイルを同じフォルダーに配置する必要があります)
import pytesseract
from PIL import Image
# 创建Image对象
image = Image.open('captcha.jpg')
# 将图片文件转化为字符串
text = pytesseract.image_to_string(image)
print(text)
正常に動作した後、内部の確認コードを抽出できます!!!
あなたが成功した場合、私にいいねを与えることを忘れないでください!!!