PDF テキスト認識 - 行ごとに読み取ります

必要

pdf は構造化されていないため、認識中に内容が乱れてしまうため、pdfbox を使用して pdf テキストを認識してください。テキストを認識する必要がある場合は、行ごとに認識できるため、内容を比較するのに便利です。

Maven 依存関係の紹介: 23 年時点の最新の依存関係

        <dependency>
            <groupId>org.apache.pdfbox</groupId>
            <artifactId>pdfbox</artifactId

おすすめ

転載: blog.csdn.net/zhijiesmile/article/details/130815178