Python を使用して単純な OCR 検索アプリケーションを構築する方法 Python を使用して独自の画像のテキスト検索を自動化する (完全なソース コードを含むチュートリアル)

光学式文字認識 (OCR) は、さまざまな種類のドキュメントを編集可能および検索可能なデータに変換するために設計された一般的なテクノロジです。

スキャンされた文書から文書の写真に至るまで、OCR はテキストを抽出し、データ抽出プロセスの自動化に役立つ効果的なツールとなり得ます。Python は最も汎用性の高い言語の 1 つであり、OCR を実行するためのさまざまなライブラリがあります。

この記事では、easyocr ライブラリを使用してローカル画像ファイルに対して OCR を実行する Python スクリプトについて説明します。

ペース

必要なライブラリをインポートします
easyocr を使用して OCR リーダーを設定します
フォルダー内の画像上のテキストを検索します
cli ツールを使用して main 関数を設定します
次に、このスクリプトの各部分を詳細に公開して理解しましょう。

1. 必要なライブラリをインポートする

import os
from PIL import Image
import argparse
from typing import List import easyocr

スクリプトはまず、必要な Python ライブラリをインポートします。

os はオペレーティング システムと対話するために使用され、スクリプトがシステム内のディレクトリを横断できるようにします。
PIL (Python Image Library) は、さまざまな画像ファイル形式を開いて操作し、保存するために使用されます。
argparse は、ユーザーが指定したコマンドを処理する使いやすいコマンド ライン インターフェイスを作成するために使用されます。
入力により、より明確な型ヒントが促進され、コードの可読性とデバッグが向上します。
easyocr は、OCR タスクを効率的に実行できるようにするライブラリです。

2. easyocr を使用して OCR リーダーをセットアップする

reader = easyocr.Reader(['en'])

この行は、英語 ('en') 用の easyocr リーダーを作成します。このリーダーは、後で画像内のテキストを認識するために使用されます。

def ocr_scan(image_path: str) -> str:
   

おすすめ

転載: blog.csdn.net/iCloudEnd/article/details/133479897