PaddleOCRの簡単なテキスト認識の使用(1)

最初にレンダリングを見てください

ここに画像の説明を挿入します

ここに画像の説明を挿入します
効果は大丈夫、いや、実際に自分で調整することはできますが、基本的には足りないので話はしません。環境設定の落とし穴を書き留めて忘れてしまいました。

使用前に環境をセットアップします。ここでは、Linuxシステムのコンピューターが手元にないため、winで構築されています。python3.7pycharm開発環境の古いノートブックで使用されているCPUにはGPUがありません。

1.パドルパドルフレームワークの下で環境を構成します

最初に公式のクイックインストールリンクを見てください:クイックインストール

ここでの公式ドキュメントの要件をインストールします。例えば、彼はpaddlepaddleバージョン1.8以上、望んでいると私は更新する必要があるので、私は唯一、1.7を持っている。現在、公式の推薦は2.0にインストールして、2.0にインストールすることです。
ここで、ディスクリートグラフィックカードがないため、最初のステップが保存されます。、GPUを使用する学生用のドライバーがインストールされている場合は、公式ドキュメントに従ってください。

2. PaddlePaddlev2.0をインストールします

python3 -m pip install --upgrade pip

如果您的机器安装的是CUDA9或CUDA10,请运行以下命令安装
python3 -m pip install paddlepaddle-gpu==2.0.0b0 -i https://mirror.baidu.com/pypi/simple

如果您的机器是CPU,请运行以下命令安装

python3 -m pip install paddlepaddle==2.0.0b0 -i https://mirror.baidu.com/pypi/simple

私はpycharmのターミナルでpython3-mを実行しているので、それは必要ありません。直接pipインストールするだけです。

示されているように

ここに画像の説明を挿入します
ここで注目に値するのは、anacondaを使用する学生は、Kuanを間違えないように注意することです。ターミナルのPython環境がよくわからない場合は、anacondaのPython環境に対応するウィンドウを開くのが最善です(私は昨日の前日にピットイン)

3. PaddleOCRリポジトリコードのクローン
を作成します。クローンを作成する前に、操作ウィンドウで作成したフォルダーを見つけられないように入力し、コードクラウドでホスティングを使用することを忘れないでください。そうしないと、速度が遅くなります。

【推荐】git clone https://github.com/PaddlePaddle/PaddleOCR

如果因为网络问题无法pull成功,也可选择使用码云上的托管:

git clone https://gitee.com/paddlepaddle/PaddleOCR

注:码云托管代码可能无法实时同步本github项目更新,存在3~5天延时,请优先使用推荐方式。

4.サードパーティライブラリをインストールします
。ここに正しいディレクトリを入力することを忘れないでください。

cd PaddleOCR
python3 -m pip install -r requirements.txt

関係者は、Windows環境では、ここからshapelyインストールパッケージをダウンロードしてインストールを完了することをお勧めします。pipを介して直接インストールされたshapelyライブラリには、[winRrror126]が指定されたモジュールを見つけられないという問題がある可能性があります。インストール時に発生しませんでした。誰かが発生した場合は、最初に手動でシェイプインストールパッケージをダウンロードします。インストール後、requirements.txtファイルにパッケージをインストールします。

インストールパッケージが完了していないというエラーが発生した場合は、次のライブラリのインストールを再度使用してください(通常は完了しています)。

#由于PaddleHub升级比较快,建议大家直接升级到最新版本的PaddleHub,无需指定版本升级
pip install paddlehub --upgrade -i https://pypi.tuna.tsinghua.edu.cn/simple 
#该Module依赖于第三方库shapely、pyclipper,使用该Module之前,请先安装shapely、pyclipper
pip install shapely -i https://pypi.tuna.tsinghua.edu.cn/simple 
pip install pyclipper -i https://pypi.tuna.tsinghua.edu.cn/simple

5.ダウンロードした公式ソースコードを調整します

まず、ideを使用する学生は、PaddleOCRフォルダーを配置することを忘れないでください。右クリックして、マークディレクトリをソースコードとして選択します(残念ながら、常に忘れてください...)

次に、一部のフォルダーはPaddleOCRで使用できないため、最初に作成する必要があります。

inference      det_db            inference_results              models
```![在这里插入图片描述](https://img-blog.csdnimg.cn/20201206222459389.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3dlaXhpbl80MzEzNDA0OQ==,size_16,color_FFFFFF,t_70)


![在这里插入图片描述](https://img-blog.csdnimg.cn/20201204192318478.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3dlaXhpbl80MzEzNDA0OQ==,size_16,color_FFFFFF,t_70)

不要问我为什么知道要创建这些,问就是看的启动命令,所以说用其他模型同理.


还有在实际运行的时候,PaddleOCR\tools\infer\predict_det.py的

```python
import tools.infer.utility as utility

見積もりが間違って報告されていないのに、見積もり対象のパッケージが同じレベルのディレクトリにあることがわかりました...
そこで、このコメントを変更して、直接次のように変更しました。

import utility

ここに画像の説明を挿入します

現時点では、基本的には大丈夫です

次に、テキスト認識用のモデルを準備しましょう
。使用できないフォルダーとそのサブフォルダーを作成することを忘れないでください。
ここに画像の説明を挿入します

2、モデルの準備

公式説明リンク:クリックして入力

ここでは、次の図に示すように、Resnet50_vdバックボーンネットワークに基づいてモデルを選択し、ICDAR2015英語データセットでトレーニングしました。

モデルリンクをダウンロードした後、解凍してPaddleOCR \ models \ det_r50_vd_dbフォルダーに配置し(ああ、このdet_r50_vd_dbフォルダーも自分で作成する必要があります)
ここに画像の説明を挿入します
、実行します。

python tools/export_model.py -c configs/det/det_r50_vd_db.yml -o Global.checkpoints="./models/det_r50_vd_db/best_accuracy" Global.save_inference_dir="./inference/det_db"

PaddleOCR \ inference \ det_dbフォルダーに変換されたモデルを生成するには
ここに画像の説明を挿入します

最後のコマンドで十分です。自分の画像パスに変更することを忘れないでください。最終的に生成される画像はPaddleOCR \ inference_resultsフォルダーにあります。

python tools/infer/predict_det.py --image_dir="./doc/imgs_en/img_10.jpg" --det_model_dir="./inference/det_db/"

おすすめ

転載: blog.csdn.net/weixin_43134049/article/details/110670762