pytesseractpsmオプションパラメータの詳細な説明

ページセグメンテーションモード:

0方向およびスクリプト検出(OSD)のみ。

1OSDによる自動ページセグメンテーション。

2自動ページセグメンテーション。ただし、OSDまたはOCRはありません。

3完全自動のページセグメンテーション。ただし、OSDはありません。(デフォルト)

4可変サイズのテキストの単一列を想定します。

5垂直に配置されたテキストの単一の均一なブロックを想定します。

6テキストの単一の均一なブロックを想定します。

7画像を単一のテキスト行として扱います。

8画像を1つの単語として扱います。

9画像を円の中の1つの単語として扱います。

10画像を1文字として扱います。

11スパーステキスト。特定の順序でできるだけ多くのテキストを検索します。

12OSDを使用したスパーステキスト。

13生のライン。画像を単一のテキスト行として扱い、

Tesseract固有のハックをバイパスします。

これは、複数のパラメーターを使用したimage_to_stringの使用例です。

target = pytesseract.image_to_string(image, lang='eng', boxes=False, \

config='--psm 10 --oem 3 -c tessedit_char_whitelist=0123456789')

おすすめ

転載: blog.csdn.net/qq_36786467/article/details/108428667