Problemas encontrados en el uso de PPOCRLabel y uso fuera de línea

PPOCRLabel es una herramienta de etiquetado semiautomática proporcionada en PaddleOCR, que es muy conveniente de usar y puede mejorar en gran medida la eficiencia del etiquetado. Esta publicación de blog registra brevemente los problemas encontrados en el uso de PPOCRLabel (esta publicación de blog solo registra la instalación y el uso de PPOCRLabel, lea la documentación para el uso de PaddleOCR).

etiqueta


1 Instale la etiqueta PPOCR

Para transferir PPOCRLabel, puede consultar directamente el proyecto original para instalar el archivo Léame, o puede seguir los pasos que mencioné a continuación.
inserte la descripción de la imagen aquí

Primero, debe clonar todo el proyecto PaddleOCR. La dirección del proyecto es:
https://github.com/PaddlePaddle/PaddleOCR/Después de clonar el proyecto, hay un archivo
en el directorio raíz del proyecto , a través del cual el entorno de dependencia de Python puede ser instalado en lotes. requirements.txtAbra una terminal en el directorio raíz e ingrese el siguiente comando para instalar:

pip install -r  requirements.txt

padelocr


instalar pala de pádel

Además requirements.txtde instalar el paquete, también debe instalar paddlepaddle. La siguiente figura es el método de instalación proporcionado por el sitio web oficial. Dado que la máquina de desarrollo win10 que uso personalmente no puede conectarse a la red externa, no la descargaré a través de fuente oficial (aquí, la versión de la CPU se descarga como ejemplo):

pip install paddlepaddle==2.0.0

inserte la descripción de la imagen aquí


instalar pyqt5

Entonces necesita instalarpyqt5

pip install pyqt5

Instale trash-cli (solo requerido para entornos Linux)

Si está en un entorno Linux, también necesita instalar trash-cli:

pip install trash-cli

Error de instalación de python-Levenshtein: se requiere Microsoft Visual C++ 14.0 o superior.

No tuve este problema cuando lo instalé en Ubuntu, pero encontré este problema en la máquina de desarrollo win 10. También hay muchas personas en Internet que dicen que necesitan instalar esto y aquello, pero no es necesario ser tan problemático. Descárguelo directamente desde este sitio web:
https://www.lfd.uci.edu/~gohlke/pythonlibs/#python-levenshtein
y luego use pip para instalarlo localmente (tenga en cuenta que los recursos en este sitio web son solo para Windows).


2 Iniciar etiqueta PPOCR

Primero ingrese al PPOCRLabeldirectorio y luego ejecute el comando de inicio ( --lang chespecifique para usar el modelo chino):

python PPOCRLabel.py --lang ch

Después de un inicio exitoso, debe descargar el peso del modelo en línea (si no puede conectarse a Internet, se informará un error y se dirá que se usará sin conexión más adelante)


Error al informar del archivo geos_c.dll no encontrado

Cuando comencé en la máquina de desarrollo win10, informé el siguiente error. Después de leer el mensaje oficial, decía que reinstalara shapelyla biblioteca (tenga en cuenta que incluso si la biblioteca se instaló correctamente a través de pip ), necesito descargar la biblioteca correspondiente shapelyde la siguiente URL Descargar shapelyDespués de la instalación local a través de pip se puede resolver.
https://www.lfd.uci.edu/~gohlke/pythonlibs/#shapely


3 Uso de PPOCRLabel sin conexión

Como se mencionó anteriormente, debe descargar los pesos del modelo en línea cuando lo inicia por primera vez. Si no hay red, se informará un error. Luego, puede ir manualmente al sitio web oficial para descargar el peso, luego copiarlo en el host fuera de línea y colocarlo de acuerdo con la estructura de directorio correspondiente antes de usarlo.
A través de la siguiente URL, puede ver los pesos utilizados por el terminal móvil oficial y el lado del servidor (el valor predeterminado es para los modelos en chino e inglés, también puede descargar modelos en otros idiomas):
https://github.com/PaddlePaddle/ PaddleOCR/blob /release/2.1/README_ch.md
inserte la descripción de la imagen aquí
Este es un ejemplo de cómo descargar el peso del modelo en el lado del servidor. Descargue el peso del modelo de detección correspondiente, el peso del clasificador de dirección y el peso del modelo de reconocimiento en el lado del servidor (tenga en cuenta que el modelo de inferencia es descargado, no el modelo de pre-entrenamiento). Después de descargar y descomprimir, obtendrá las siguientes tres carpetas, cada una de las cuales tiene inference.pdiparamstres inference.pdiparams.infoarchivos inference.pdmodel:

inserte la descripción de la imagen aquí


Estructura de ubicación del directorio de archivos de Linux

Si es un sistema Linux, hay un directorio bajo su propio usuario .paddleocr, si no crea uno usted mismo, por ejemplo, mi usuario wzlo tiene /home/wz/.paddleocr. Coloque los pesos anteriores en las carpetas correspondientes en orden.

├── .paddleocr: 
│    ├── cls: 存放分类器的权重(分类器不分语言)
│    │     ├── inference.pdiparams
│    │     ├── inference.pdiparams.info
│    │     └── inference.pdmodel
│    │
│    └── 2.1: 注意该目录的名称是根据当前release版本来的,当前使用的release版本是2.1 
│          ├── det: 存放检测器的权重
│          │     └── ch: 代表中英文模型
│          │         ├── inference.pdiparams
│          │         ├── inference.pdiparams.info
│          │         └── inference.pdmodel
│          │
│          └── rec: 存放识别器的权重
│               └── ch: 代表中英文模型
│                     ├── inference.pdiparams
│                     ├── inference.pdiparams.info
│                     └── inference.pdmodel

Estructura del directorio de archivos de Windows

Si es un sistema Windows, hay un directorio bajo su propio usuario .paddleocr, si no crea uno usted mismo, por ejemplo, mi usuario adminlo tiene C:\User\admin\.paddleocr. Coloque los pesos anteriores en las carpetas correspondientes en orden.

├── .paddleocr: 
│    ├── cls: 存放分类器的权重(分类器不分语言)
│    │     ├── inference.pdiparams
│    │     ├── inference.pdiparams.info
│    │     └── inference.pdmodel
│    │
│    └── 2.1: 注意该目录的名称是根据当前release版本来的,当前使用的release版本是2.1 
│          ├── det: 存放检测器的权重
│          │     └── ch: 代表中英文模型
│          │         ├── inference.pdiparams
│          │         ├── inference.pdiparams.info
│          │         └── inference.pdmodel
│          │
│          └── rec: 存放识别器的权重
│               └── ch: 代表中英文模型
│                     ├── inference.pdiparams
│                     ├── inference.pdiparams.info
│                     └── inference.pdmodel

4 PPOCRLabel utiliza sus propios pesos entrenados

Esto es similar a usar PPOCRLabel sin conexión, solo necesita entrenar y convertir el peso de su propio modelo y colocarlo en el directorio de archivos correspondiente.

Supongo que te gusta

Origin blog.csdn.net/qq_37541097/article/details/118638695
Recomendado
Clasificación