テキスト関連の画像処理は、現在応用範囲が広がっている方向にあり、私は普段、いくつかの情報を読んで、将来のために以下のようにリンクを整理して収集しています。全体的な印象としては、Baidu の PaddleOCR は中国では比較的優れたオープンソース OCR であると考えられています。論文に関しては、毎年いくつかの論文が掲載され、最先端の技術を知ることができます。
DB および CRNN メソッドに基づいた水道メーターの測定値の自動認識
PDF テーブル抽出 Excel アルゴリズムはオープンソースであり、このオープンソース プロジェクトは数百万ドルの価値があります
重厚なオープンソース!平安不動産は TableMASTER: テーブル認識マスターを提案
DB シーンテキスト検出のための新しいネットワーク | AAAI2020
効果は 7% 増加し、速度は 220% 増加し、OCR オープンソース アーティファクト PaddleOCR が再びアップグレードされました
TrOCR: Transformer に基づく新世代の光学式文字認識