PPOCRLabel es una herramienta de etiquetado semiautomática proporcionada en PaddleOCR, que es muy conveniente de usar y puede mejorar en gran medida la eficiencia del etiquetado. Esta publicación de blog registra brevemente los problemas encontrados en el uso de PPOCRLabel (esta publicación de blog solo registra la instalación y el uso de PPOCRLabel, lea la documentación para el uso de PaddleOCR).
Directorio de artículos
1 Instale la etiqueta PPOCR
Para transferir PPOCRLabel, puede consultar directamente el proyecto original para instalar el archivo Léame, o puede seguir los pasos que mencioné a continuación.
Primero, debe clonar todo el proyecto PaddleOCR. La dirección del proyecto es:
https://github.com/PaddlePaddle/PaddleOCR/Después de clonar el proyecto, hay un archivo
en el directorio raíz del proyecto , a través del cual el entorno de dependencia de Python puede ser instalado en lotes. requirements.txt
Abra una terminal en el directorio raíz e ingrese el siguiente comando para instalar:
pip install -r requirements.txt
instalar pala de pádel
Además requirements.txt
de instalar el paquete, también debe instalar paddlepaddle. La siguiente figura es el método de instalación proporcionado por el sitio web oficial. Dado que la máquina de desarrollo win10 que uso personalmente no puede conectarse a la red externa, no la descargaré a través de fuente oficial (aquí, la versión de la CPU se descarga como ejemplo):
pip install paddlepaddle==2.0.0
instalar pyqt5
Entonces necesita instalarpyqt5
pip install pyqt5
Instale trash-cli (solo requerido para entornos Linux)
Si está en un entorno Linux, también necesita instalar trash-cli
:
pip install trash-cli
Error de instalación de python-Levenshtein: se requiere Microsoft Visual C++ 14.0 o superior.
No tuve este problema cuando lo instalé en Ubuntu, pero encontré este problema en la máquina de desarrollo win 10. También hay muchas personas en Internet que dicen que necesitan instalar esto y aquello, pero no es necesario ser tan problemático. Descárguelo directamente desde este sitio web:
https://www.lfd.uci.edu/~gohlke/pythonlibs/#python-levenshtein
y luego use pip para instalarlo localmente (tenga en cuenta que los recursos en este sitio web son solo para Windows).
2 Iniciar etiqueta PPOCR
Primero ingrese al PPOCRLabel
directorio y luego ejecute el comando de inicio ( --lang ch
especifique para usar el modelo chino):
python PPOCRLabel.py --lang ch
Después de un inicio exitoso, debe descargar el peso del modelo en línea (si no puede conectarse a Internet, se informará un error y se dirá que se usará sin conexión más adelante)
Error al informar del archivo geos_c.dll no encontrado
Cuando comencé en la máquina de desarrollo win10, informé el siguiente error. Después de leer el mensaje oficial, decía que reinstalara shapely
la biblioteca (tenga en cuenta que incluso si la biblioteca se instaló correctamente a través de pip ), necesito descargar la biblioteca correspondiente shapely
de la siguiente URL Descargar shapely
Después de la instalación local a través de pip se puede resolver.
https://www.lfd.uci.edu/~gohlke/pythonlibs/#shapely
3 Uso de PPOCRLabel sin conexión
Como se mencionó anteriormente, debe descargar los pesos del modelo en línea cuando lo inicia por primera vez. Si no hay red, se informará un error. Luego, puede ir manualmente al sitio web oficial para descargar el peso, luego copiarlo en el host fuera de línea y colocarlo de acuerdo con la estructura de directorio correspondiente antes de usarlo.
A través de la siguiente URL, puede ver los pesos utilizados por el terminal móvil oficial y el lado del servidor (el valor predeterminado es para los modelos en chino e inglés, también puede descargar modelos en otros idiomas):
https://github.com/PaddlePaddle/ PaddleOCR/blob /release/2.1/README_ch.md
Este es un ejemplo de cómo descargar el peso del modelo en el lado del servidor. Descargue el peso del modelo de detección correspondiente, el peso del clasificador de dirección y el peso del modelo de reconocimiento en el lado del servidor (tenga en cuenta que el modelo de inferencia es descargado, no el modelo de pre-entrenamiento). Después de descargar y descomprimir, obtendrá las siguientes tres carpetas, cada una de las cuales tiene inference.pdiparams
tres inference.pdiparams.info
archivos inference.pdmodel
:
Estructura de ubicación del directorio de archivos de Linux
Si es un sistema Linux, hay un directorio bajo su propio usuario .paddleocr
, si no crea uno usted mismo, por ejemplo, mi usuario wz
lo tiene /home/wz/.paddleocr
. Coloque los pesos anteriores en las carpetas correspondientes en orden.
├── .paddleocr:
│ ├── cls: 存放分类器的权重(分类器不分语言)
│ │ ├── inference.pdiparams
│ │ ├── inference.pdiparams.info
│ │ └── inference.pdmodel
│ │
│ └── 2.1: 注意该目录的名称是根据当前release版本来的,当前使用的release版本是2.1
│ ├── det: 存放检测器的权重
│ │ └── ch: 代表中英文模型
│ │ ├── inference.pdiparams
│ │ ├── inference.pdiparams.info
│ │ └── inference.pdmodel
│ │
│ └── rec: 存放识别器的权重
│ └── ch: 代表中英文模型
│ ├── inference.pdiparams
│ ├── inference.pdiparams.info
│ └── inference.pdmodel
Estructura del directorio de archivos de Windows
Si es un sistema Windows, hay un directorio bajo su propio usuario .paddleocr
, si no crea uno usted mismo, por ejemplo, mi usuario admin
lo tiene C:\User\admin\.paddleocr
. Coloque los pesos anteriores en las carpetas correspondientes en orden.
├── .paddleocr:
│ ├── cls: 存放分类器的权重(分类器不分语言)
│ │ ├── inference.pdiparams
│ │ ├── inference.pdiparams.info
│ │ └── inference.pdmodel
│ │
│ └── 2.1: 注意该目录的名称是根据当前release版本来的,当前使用的release版本是2.1
│ ├── det: 存放检测器的权重
│ │ └── ch: 代表中英文模型
│ │ ├── inference.pdiparams
│ │ ├── inference.pdiparams.info
│ │ └── inference.pdmodel
│ │
│ └── rec: 存放识别器的权重
│ └── ch: 代表中英文模型
│ ├── inference.pdiparams
│ ├── inference.pdiparams.info
│ └── inference.pdmodel
4 PPOCRLabel utiliza sus propios pesos entrenados
Esto es similar a usar PPOCRLabel sin conexión, solo necesita entrenar y convertir el peso de su propio modelo y colocarlo en el directorio de archivos correspondiente.