パドル OCR フレームワークはデジタルの問題と解決策を特定します

識別された文字列が繰り返されます

ケース 1: 検出エラー。同じ文字列が 2 回検出されます。
たとえば、「12 plan」は
「12」「2 plan」として認識されます。これを x 座標で横切ることができ、最初の結果の最後の文字が結果の先頭文字が同じかどうか判定

ケース 2: 認識エラー。11 が 111 として認識されます
。テキストの周囲に空白領域が多すぎる可能性があります。テキスト領域がアウトラインで切り取られます。det を False に設定すると、認識率が向上します。

この行の文字列が長すぎるため、認識が不完全です。

認識結果が空です

サイズ変更された画像のアスペクト比は 1:10 で、検出と認識率が向上します
。適切なパディングにより、画像の上部と下部のピクセルを増やすことができます。

文字列の一部のみが検出されました

上記と同じですが、一部のテキストは依然として見逃され、認識されない可能性があります。

1桁の認識率が低い

アウトラインを通してデジタル領域をトリミングします。det を False に設定すると、認識率が向上します。

おすすめ

転載: blog.csdn.net/weixin_38235865/article/details/132321123
おすすめ