El último tutorial completo de alquimia, usando PaddleOCR y entrenando el modelo usted mismo, el anciano dijo que era bueno después de leerlo.


PD: Para comodidad de los lectores, todos los archivos que deben usarse en el artículo se comparten y descargan usando mi disco de red, y también se proporcionará la dirección de descarga del sitio web oficial.

Prefacio ______ Instalación y preparación de PaddleOcr

1. Instalación de componentes relacionados con PaddleOcr que ya he introducido en el blog anterior → Guía de instalación y uso de PaddleOcrhaz clic para saltar
2. Descarga el paquete de archivos oficial de PaddleOcr,
https://kyc592.lanzous.com/i5C7Gkojm7c Contraseña: kyc

O dirección de descarga del sitio web oficial: https://gitee.com/paddlepaddle/PaddleOCR
paddleocr

Luego descomprímalo en el directorio raíz de la carpeta del proyecto.
Preparativos completos
Asegúrese de completar la operación de acuerdo con el blog anterior, Paddleocr puede ejecutarse normalmente y minimizar el trabajo de depuración extremadamente pesado en el futuro.
Esto completa el trabajo preparatorio.

Preparación de datos

Para entrenar su propio modelo, los materiales que necesita son:
① Conjunto de imágenes para entrenamiento ② Conjunto de imágenes para prueba ③ Archivos de anotaciones para los dos conjuntos de imágenes anteriores ④ Modelo de entrenamiento previo

1. Descarga la galería de fotos de icdar2015

Demostración ①Conjunto de imágenes para entrenamiento ②Conjunto de imágenes para prueba ③Los archivos de anotaciones de los dos conjuntos de imágenes anteriores son todos del conjunto de datos icdar2015 ya hecho , si está interesado en recopilar el conjunto de imágenes y generar el archivo de anotaciones de apoyo, haga clic para saltar a → * ¿Cómo crear su propio conjunto de datos?

Primero descargue los dos conjuntos de imágenes,
ch4_ training _images.zip es el conjunto de imágenes de entrenamiento del conjunto de datos icdar2015 , un total de 1000
https://kyc592.lanzous.com/iKdkQkpytcf Contraseña: kyc
ch4 _ test _images.zip es el icdar2015 datos Una colección de imágenes de prueba , un total de 500 hojas
https://kyc592.lanzous.com/isNpFkpzb5g Contraseña: kyc

Tenga en cuenta que las dos colecciones de imágenes no deben usarse incorrectamente

o la dirección de descarga del sitio web oficial: https://rrc.cvc.uab.es/?ch=4&com=downloads, debe registrarse e iniciar sesión antes de descargar.
Conjunto de datos de 2015

2. Descargue el archivo de anotaciones que respalda el conjunto de datos icdar2015

train _icdar2015_label.txt es el archivo de etiqueta de apoyo para el conjunto de entrenamiento :
https://kyc592.lanzous.com/i9aPSkpzp1g Contraseña: kyc
test _icdar2015_label.txt es el archivo de etiqueta de apoyo para el conjunto de prueba :
https: //kyc592.lanzous. com / i72mHkpzp0f Contraseña: kyc

Tenga en cuenta que los dos archivos de etiquetas no deben usarse incorrectamente

o la dirección de descarga oficial:el archivo de etiquetas de respaldo para el
conjunto de capacitación : https://paddleocr.bj.bcebos.com/dataset/train_icdar2015_label.txtEl archivo de etiquetas de respaldo para la
prueba conjunto :
https: / /paddleocr.bj.bcebos.com/dataset/test_icdar2015_label.txt

3. Organizar la ruta del conjunto de datos

[Se recomienda escribir rutas absolutas para todas las siguientes rutas]

Descomprima las dos colecciones de imágenes descargadas en el primer paso y
guárdelas en la carpeta train_data con los archivos de anotaciones correspondientes descargados en el segundo paso como se muestra en las imágenes. (Un total de dos carpetas, dos documentos)camino

4. Descarga el modelo previamente entrenado

El modelo de detección de PaddleOCR actualmente admite 3 redes troncales, a saber, MobileNetV3, ResNet18_vd y ResNet50_vd. El modelo en PaddleClas se puede utilizar para reemplazar la red troncal según sea necesario.

Información relacionada:
En
respuesta a la necesidad urgente de aplicar tecnología de aprendizaje profundo en el lado móvil, MobileNet se desempeña bien en lugares con poco espacio de almacenamiento y bajo consumo de energía. En el caso de precisión de baja pérdida, tiene cálculos, espacio de almacenamiento y precisión Mejorado significativamente.

El modelo de la serie
ResNet ResNet propuso de manera innovadora una estructura residual y ganó el campeonato en la competencia ILSVRC2015 de una sola vez, con una tasa de error top5 del 3,57%. Joyce
Xu de la Universidad de Stanford calificó a ResNet como una de las tres arquitecturas que "realmente redefine la forma en que vemos las redes neuronales".

Dirección de descarga oficial:

Modelo preentrenado de MobileNetV3:
https://paddle-imagenet-models-name.bj.bcebos.com/MobileNetV3_large_x0_5_pretrained.tar

Modelo pre-entrenado ResNet18_vd:
https://paddle-imagenet-models-name.bj.bcebos.com/ResNet18_vd_pretrained.tar

Modelo preentrenado ResNet50_vd:
https://paddle-imagenet-models-name.bj.bcebos.com/ResNet50_vd_ssld_pretrained.tar

Abra el enlace para que aparezca una solicitud de descarga.
La demostración aquí utiliza el modelo pre-entrenado ResNet50_vd.

5. Organizar la ruta del modelo de formación previa

Cree una nueva carpeta pretain_models y descomprima el modelo previamente entrenado descargado. camino
Busque el archivo det_mv3_db_v1.1.yml en la carpeta config / det, solo necesita
especificar " pretrain _weights" como la ruta del modelo preentrenado obtenido anteriormente.
original
El mío es D: \ PO \ pretain_models \ ResNet50_vd_ssld_pretrained
Después de la modificación

6. Modifique el archivo de configuración

①Encuentre el script program.py en la carpeta de herramientas y ábralo, busque el constructor de la clase ArgsParser
Cambiar parámetros
y luego agregue una línea de código a la línea apuntada por la flecha en la figura

default = "D:\PO\configs\det\det_mv3_db_v1.1.yml",

Modifíquelo para
Modifica el código
tener en cuenta que la ruta del archivo se completa correctamente de acuerdo con su computadora.

注意相对路径填写规则
“./ ”表示同级目录,
“../”表示上级目录,
“../../”表示上上级目录,
(以运行的.py文件为当前路径)

② Busque el archivo det_db_icdar15_reader.yml en la carpeta config / det y ábralo (puede abrirlo con software como pycharm o Typora) y archivo yml
modificar
modifique estas cuatro líneas correctamente de acuerdo con su computadora.
Las cuatro líneas son la ruta del conjunto de imágenes de entrenamiento, la ruta del archivo de anotación para el conjunto de imágenes de entrenamiento, la ruta del conjunto de imágenes de prueba y la ruta del archivo de anotaciones para el conjunto de imágenes de prueba.
Modificación completada

La modificación está completa.

Configurar, comenzar a entrenar

Es el emocionante enlace DEBUG.

Ejecute el script train.py en la carpeta de herramientas.
Q1: No se puede adjuntar el informe de prueba al marco de prueba
No se puede adjuntar el informe de prueba al marco de prueba

A1: No use pytest para abrir, use la forma normal para abrir
Seleccione este lugar en la esquina superior derecha, haga clic en Editar configuraciones / Editar configuraciones ... Editar configuración
Haga clic en el signo menos para eliminar la configuración actual, Eliminar
luego haga clic en el signo más y haga clic en Python para añadir
modificarlo con el nombre de archivo y la ruta del archivo, y luego guardar el recuento de operación normal. modificar
P2: Indica que falta el archivo FileNotFoundError: [Errno 2] No existe ese archivo o directorio: ' archivo perdido
./configs/det/ det_db_icdar15_reader.yml' A2: Es porque ./ está buscando el archivo en la carpeta del mismo nivel, simplemente coloque todas las configuraciones directamente Copie la carpeta a la carpeta de herramientas donde se encuentra el script. Los dos están al mismo nivel. Copiar
Problemas similares también toman este método para copiar las carpetas que faltan a la carpeta de herramientas.

P3: No hay gpu. ERROR: ¡La configuración use_gpu no se puede establecer como verdadera mientras está usando la versión de cpu paddlepaddle! Sin gpu
A3: Si usa cpu para entrenar el modelo, simplemente cambie todos los archivos en la carpeta tools / configs que tienen instrucciones use_gpu: en esta línea de código a falso , La carpeta configs en el directorio raíz hace lo mismo. modificarllevar a cabo
P4: Indicación de que el conjunto de imágenes de entrenamiento no existe 2021-01-23 14:10:54, 107-INFO: D: \ PO \ train_data \ ch4_training_imagesicdar_c4_train_imgs / img_999.jpg ¡no existe! no existe
A5: ¡Es fácil de encontrar que es porque el nombre de la carpeta donde se almacenan las imágenes es inconsistente, solo modifícalo.
1
2
P6: De repente, el uso de la CPU y la memoria se disparó más que el círculo reciente de melones. El
1
resultado es así
2

A6: Básicamente exitoso en el aprendizaje de la alquimia. Apague el programa y ejecútelo en una buena computadora.

¿Cómo crear su propio conjunto de datos?

Utilice el script PPOCRLabel.py en la carpeta PPOCRLabel (asegúrese de instalar pyqt5 primero)
Sitio web oficial de PPOCRLabel: https://gitee.com/computer-vision/PaddleOCR/blob/develop/PPOCRLabel/README.md Después de guión
ejecutar esta ventana emergente ventana
en el menú En la barra, haga clic en "archivo" - "abrir directorio abrir dir" Seleccione
Carpeta abierta
PaddleOCR en la barra de menú de la carpeta de la imagen a marcar , haga clic en "Marcar automáticamente el reconocimiento automático", utilice el PPOCR ultraligero modelo para establecer el estado de la imagen antes del nombre del archivo de imagen en "✖". Las imágenes se etiquetan automáticamente.
Etiquetado automático
Espere a que se complete la anotación.
En g
Luego haga clic en Verificar en la esquina inferior derecha, la X en frente de la imagen cambiará a √ (con la ayuda de la macro del mouse o el dispositivo de puntos)
Salvar
En este momento, haga clic en archivo y haga clic en guardar etiqueta, puede encontrar su archivo de etiqueta en la ruta del mensaje emergenteEtiqueta
1

Evaluación y comprobación de modelos

Actualizar más tarde...

Supongo que te gusta

Origin blog.csdn.net/kyc592/article/details/112981848
Recomendado
Clasificación