Hallo zusammen, ich bin Weixue AI. Heute werde ich Ihnen den gesamten Prozess des Deep-Learning-Praxis-34-basierten Paddle-Key-Informationsextraktionsmodelltrainings vorstellen. Im Dokumentanwendungsszenario haben wir die Aufgabe, Schlüsselinformationen wie den Schlüssel zu extrahieren Informationen im Personalausweis. Name und Adresse, Name und Kontaktinformationen in der Kurierrechnung usw. Der traditionelle Ansatz erfordert Designvorlagen, aber das ist zu umständlich und nicht robust genug. Aus diesem Grund haben wir das Schlüsselinformations-Extraktionsschema in der PaddleOCR-Toolbox von Fei Paddle verwendet, mit dem die Schlüsselinformationen in der Mehrwertsteuerrechnung schnell extrahiert werden können. Als Nächstes werde ich Ihnen beibringen, wie Sie das Modell zur Extraktion von Paddle-Key-Informationen trainieren.
Im Folgenden werde ich den gesamten Prozess des Trainings des Schlüsselinformationsextraktionsmodells basierend auf Paddle vorstellen und die folgenden Schritte ausführen:
1. Daten beschriften
1. Installieren Sie das Paket
pip install PPOCRLabel
2. Verwenden Sie nach der Installation den folgenden Befehl zum Starten
PPOCRLabel --lang=ch --kie=True ([KIE-Modus] starten, wird zum Beschriften der Szene von [Erkennung + Erkennung + Schlüsselwortextraktion] verwendet)
Nach dem Öffnen sieht die Schnittstelle wie folgt aus: