Reconocimiento de imágenes basado en el modelo de ResNet de aprendizaje profundo

 

Comience a responder:

  La dirección de nuestro proyecto es el reconocimiento de imágenes basado en el aprendizaje profundo. Se puede decir que el reconocimiento de imágenes es una tecnología muy básica y prometedora en inteligencia artificial.

  La tecnología de reconocimiento de imágenes por computadora tiene aplicaciones en muchos campos, como seguridad pública, biología, industria, agricultura, transporte y tratamiento médico.

Por ejemplo, el sistema de reconocimiento de matrículas en el transporte; tecnología de reconocimiento facial y tecnología de reconocimiento de huellas dactilares en seguridad pública; tecnología de reconocimiento de semillas en agricultura, tecnología de detección de calidad de los alimentos; tecnología de reconocimiento de electrocardiogramas en el campo médico. Con el desarrollo continuo de la tecnología informática, la tecnología de reconocimiento de imágenes también se optimiza continuamente, y su algoritmo también se mejora continuamente.

 

  Nuestro equipo implementó un sistema de reconocimiento de imágenes utilizando el modelo ResNet en el aprendizaje automático y la base de datos cifar10 existente. Después de nuestras pruebas, la precisión del sistema para imágenes era tan alta como 90%. Debido a la falta de equipo, nuestra mejora de la red es muy lenta También es muy laborioso y se considera insatisfactorio para lograr este resultado.

  A continuación, responderé a los dos aspectos del modelo de red y la selección del conjunto de datos.

  El modelo de red que utilizamos fue propuesto por ResNet por tres académicos chinos en 2015. Este modelo tiene las siguientes ventajas sobre otras redes.

 

 

 

  Se introduce un marco de aprendizaje residual profundo. En lugar de permitir que algunas capas apiladas aprendan las características originales directamente, las capas apiladas se utilizan para ajustarse al mapa residual.

  ResNet puede obtener un aumento en la precisión de la mayor profundidad, y los resultados producidos por Resnet también han actualizado el registro en ese momento.

  ResNet tiene una gran escalabilidad, y cuando la red se incrementa a 100 o incluso 1000 capas, aún no habrá problemas de degradación.

  Así que aquí usamos esta red para realizar tecnología de reconocimiento de imágenes

 

  Permítanme presentarles el conjunto de datos cifar10, que se compone de 60,000 imágenes en color 32x32 en 10 categorías, con 6000 imágenes en cada categoría. Hay 50,000 imágenes de entrenamiento y 10,000 imágenes de prueba.

  El conjunto de entrenamiento es un pequeño conjunto de datos recopilado por Alex e Ilya para identificar objetos universales, que es universal y práctico. Entonces tomamos este conjunto de datos.

  Después del experimento, también obtuvimos mejores resultados de entrenamiento.

  

 

 

 

  El sistema también es muy simple de usar. Guarde la imagen en la carpeta img y asígnele el nombre name.jpg, y luego ejecute el programa predict.py directamente para obtener el resultado.

  Este sistema es el primer proyecto de nuestro equipo. Después de ver el resultado, estamos extasiados y esperamos obtener la aprobación de todos.

  El siguiente video muestra el efecto de medición real del sistema.

 

  

  

Supongo que te gusta

Origin www.cnblogs.com/bianjunting/p/12722412.html
Recomendado
Clasificación