最近ocrテキスト認識を行っており、tesseractトレーニングツールをインストールするプロセスを記録しました

最近ocrテキスト認識を行っており、tesseractトレーニングツールをインストールするプロセスを記録しました

tesseract の API を呼び出すにはインストールする必要はありません (exe をインストールして環境変数を設定することもできます)。vs で設定するだけです (opencv と同様)

他人や関係者がトレーニングしたモデルが自分のプロジェクトでうまく機能しない場合は、モデルをトレーニングする必要があります。トレーニングのためにインストールする必要がある 3 つのツールは次のとおりです。

  1. tesseract: 一部のブロガーは、dev、alpha、beta などをダウンロードしないことを推奨しています。これは不安定であり、テスト バージョンである可能性があります。皆さんここに注目してください。インストールしました:tesseract-ocr-setup-4.0.0dev-20161129.exe
  2. Java JDK: Java 環境をインストールする必要があります。私は jdk-8u311-windows-x64.exe をインストールしました。
  3. jTessBoxEditor: ダウンロード後にインストールする必要はなく、JDK が正しくインストールされていれば、直接起動してトレーニングに使用できます。

注: Java JDK をインストールする場合、インストール プロセス中に 2 つのインストール プロンプトが表示されます。1 回目は jdk をインストールし、2 回目は jre をインストールします。両方を同じ Java フォルダー内の異なるフォルダーにインストールすることをお勧めします。(Java フォルダーのルート ディレクトリにはインストールできません。jdk と jre を同じフォルダーにインストールするとエラーが発生します) (Baidu ライブラリより: https://jingyan.baidu.com/article/6dad5075d1dc40a123e36ea3.html) また、システム変数を構成するときは、次の 2 つを構成する必要があります。 1: JAVA_HOME という名前の新しい変数を作成します。変数の値は、j​​dk のインストール ディレクトリ (例: D\Java\) jdk1.8.0) 2: パス;%JAVA_HOME%\bin に入力します (前に があることに注意してください。忘れない
ください)


おすすめ

転載: blog.csdn.net/qq_43207709/article/details/121561859