Подробное объяснение параметров опции pytesseract psm

Режимы сегментации страницы:

0 Только ориентация и обнаружение сценария (OSD).

1 Автоматическая сегментация страниц с помощью экранного меню.

2 Автоматическая сегментация страниц, без OSD или OCR.

3 Полностью автоматическая сегментация страниц, но без экранного меню. (По умолчанию)

4 Предположим, что один столбец текста переменного размера.

5 Предположим, что один однородный блок вертикально выровненного текста.

6 Предположим, что это один однородный блок текста.

7 Рассматривайте изображение как одну текстовую строку.

8 Обращайтесь с изображением как с одним словом.

9 Рассматривайте изображение как отдельное слово в круге.

10 Относитесь к изображению как к одному символу.

11 Редкий текст. Найдите как можно больше текста в произвольном порядке.

12 Разреженный текст с экранным меню.

13 Необработанная линия. Рассматривайте изображение как одну текстовую строку,

обход хаков, специфичных для Tesseract.

Вот пример использования image_to_string с несколькими параметрами.

target = pytesseract.image_to_string(image, lang='eng', boxes=False, \

config='--psm 10 --oem 3 -c tessedit_char_whitelist=0123456789')

рекомендация

отblog.csdn.net/qq_36786467/article/details/108428667