Red de reconstrucción de superresolución - DASR

mejora de la imagen de vídeo


1. Introducción

Para animarse a sí mismo a estudiar mucho, Bibo escribe lo que ha aprendido recientemente en un blog /(ㄒoㄒ)/~~
inserte la descripción de la imagen aquí


2. DASR

2.1 Papeles y código

Si quieres saber más sobre la idea de esta red, te recomiendo que leas el enlace del blogger de abajo, habla mejor que yo, así que no me explicaré demasiado.
Interpretación del documento: https://blog.csdn.net/weixin_43972154/article/details/119327182
En cuanto a aprender el código, está bien seguir los pasos de operación del autor paso a paso. Para aprender una nueva red, lo más importante La cosa es reproducir el código.
Enlace de código: https://github.com/The-Learning-And-Vision-Atelier-LAVA/DASR

3. Reproducción de código

3.1 Preparar el entorno

Dado que el entorno de pytorch utilizado por el autor es relativamente antiguo, siempre habrá problemas inimaginables al utilizar una versión superior de pytorch Para ahorrar tiempo, le sugiero que utilice un entorno virtual. Es muy simple de operar, solo tres pasos:

  1. Cree un entorno virtual conda create -n pytorch1.1 python=3.6y encuentre opciones de selección en el caminoy
  2. Activar el entorno virtual creadoactivate pytorch1.1
  3. Instale los paquetes requeridos en el entorno virtual activado pip install -i https://pypi.douban.com/simple -r requirement.txt(recuerde poner los paquetes requeridos en un archivo txt)

3.2 Preparación de datos

inserte la descripción de la imagen aquí
Descarga estos dos datos y colócalos en una carpeta, para evitar menos errores, llamamos a la carpeta comoDF2K

  1. PrepararDIV2K

DIV2KEnlace de descarga del conjunto de datos: https://data.vision.ee.ethz.ch/cvl/DIV2K/
Hay muchos conjuntos de datos en este enlace. No supe qué conjuntos de datos descargar en ese momento y casi los descargué todos. Tenga en cuenta que solo necesita Descargar estos dos conjuntos de datos En cuanto a por qué, puede leer la interpretación del documento que proporcioné anteriormente.
inserte la descripción de la imagen aquí

  1. PrepararFlickr2K

Flickr2KEnlace de descarga del conjunto de datos: https://cv.snu.ac.kr/research/EDSR/Flickr2K.tar

  1. Combinar datos

Después de descargar los datos, colóquelos en la carpeta DF2K, que se ve así.
inserte la descripción de la imagen aquí
Una red cuidadosa puede preguntar por qué solo tengo 900 imágenes, porque mi computadora no tiene suficiente memoria de video y solo uso el DIV2Kconjunto de datos para entrenamiento.
inserte la descripción de la imagen aquí

3.3 Empezar a entrenar

main.shEl siguiente paso es comenzar a entrenar. El código de entrenamiento se puede ejecutar directamente si usa un servidor . Si no tiene condiciones, puede usar el siguiente comando:

python main.py --dir_data=./dataset/ --model=blindsr --scale=4 --blur_type=aniso_gaussian --noise=25.0 --lambda_min=0.2 --lambda_max=4.0

El proceso de entrenamiento es probablemente así
inserte la descripción de la imagen aquí


Tenga en cuenta los siguientes problemas:
inserte la descripción de la imagen aquí
inserte la descripción de la imagen aquí


3.4 Datos de prueba

inserte la descripción de la imagen aquí

  1. El documento original preparó cuatro conjuntos de datos de prueba, hablemos sobre el [enlace de descarga] de los datos. (https://github.com/XPixelGroup/BasicSR/blob/a19aac61b277f64be050cef7fe578a121d944a0e/docs/Datasets.md)
    inserte la descripción de la imagen aquí
  2. Solo usé Set14el conjunto de datos cuando probé, usé estas dos carpetas.

inserte la descripción de la imagen aquí

  1. Coloque Set14las HRimágenes y LRlas imágenes en benchmarkla carpeta, y el formato de archivo de almacenamiento de datos es así.

inserte la descripción de la imagen aquí


3.5 Iniciar la prueba

inserte la descripción de la imagen aquí
Lo siguiente es para iniciar la prueba, el comando de prueba es el siguiente:

 python test.py --test_only  --dir_data=./dataset/ --data_test=Set14 --model=blindsr  --scale=4 --resume=114 --blur_type=aniso_gaussian --noise=10.0 --theta=0.0  --lambda_1=0.2 --lambda_2=4.0 --save_results=True

inserte la descripción de la imagen aquí
Las siguientes preguntas:
inserte la descripción de la imagen aquí
Además, también puedes usar los pesos oficiales para una prueba rápida.
inserte la descripción de la imagen aquí

3.6 Resultados de la prueba

Cabe mencionar aquí que los resultados del proceso de entrenamiento se guardan experimenten el archivo, y el modo que utilice estará en la carpeta.
inserte la descripción de la imagen aquí
Aquí está lo siguiente, los resultados de mi entrenamiento, porque solo entrené 114epoch, entonces el efecto no es bueno, mostrémoslo con dificultad.
inserte la descripción de la imagen aquí
inserte la descripción de la imagen aquí

inserte la descripción de la imagen aquí


4. Mi Código

El siguiente es el enlace a mi código. Los estudiantes perezosos pueden descargar mi código directamente. Ya he descargado todos los datos, por lo que no necesito molestarme en descargar los conjuntos de datos uno por uno, solo utilícelos directamente.
Enlace: https://pan.baidu.com/s/1f_Gq-pvMyfth-FebiYpx7A
Código de extracción: fasf
: compartir del super miembro V5 de Baidu Netdisk

Supongo que te gusta

Origin blog.csdn.net/CharmsLUO/article/details/125332095
Recomendado
Clasificación