テキストOCR関連のデータ収集

テキスト関連の画像処理は、現在応用範囲が広がっている方向にあり、私は普段、いくつかの情報を読んで、将来のために以下のようにリンクを整理して収集しています。全体的な印象としては、Baidu の PaddleOCR は中国では比較的優れたオープンソース OCR であると考えられています。論文に関しては、毎年いくつかの論文が掲載され、最先端の技術を知ることができます。

ドキュメント画像の検索 | コード付き論文

PaddleOCR: PaddlePaddle をベースにした素晴らしい多言語 OCR ツールキット(実用的な超軽量 OCR システム、80 以上の言語認識をサポート、データ注釈と合成ツールを提供、サーバー、モバイル、組み込み、IoT デバイス間でのトレーニングと展開をサポート)

DB および CRNN メソッドに基づいた水道メーターの測定値の自動認識

PDF テーブル抽出 Excel アルゴリズムはオープンソースであり、このオープンソース プロジェクトは数百万ドルの価値があります

重厚なオープンソース!平安不動産は TableMASTER: テーブル認識マスターを提案

DB シーンテキスト検出のための新しいネットワーク | AAAI2020

効果は 7% 増加し、速度は 220% 増加し、OCR オープンソース アーティファクト PaddleOCR が再びアップグレードされました

TrOCR: Transformer に基づく新世代の光学式文字認識

論文推薦 | 【AAAI 2020】境界からテキストへ—任意形状のテキストの検出手法

GitHub - open-mmlab/mmocr: OpenMMLab テキスト検出、認識、理解ツールボックス

おすすめ

転載: blog.csdn.net/u013685264/article/details/125264721