Ruta de inicio del sistema de conocimientos de aprendizaje por refuerzo gratuito

Introducción a los sistemas de aprendizaje por refuerzo

Un poco de intercambio de experiencias, muchas personas compartieron los cursos o artículos que vieron, pero nadie compartió su propia experiencia en el aprendizaje sistemático o la investigación científica. De hecho, al reproducir un artículo, a menudo se puede ver lo que el autor original aprendió y lo hizo. Para esto tesis, una buena experiencia de aprendizaje sistemático es muy importante. Puede encontrar una manera de ascender rápidamente entre muchos conocimientos gratuitos, y el costo es su propio tiempo. El proceso de aprendizaje es muy importante, al igual que la experiencia del examen de ingreso de posgrado, pero necesita buscar la verdad en los hechos, y el que más te convenga es el mejor.


teoría

El siguiente es un resumen más sistemático de mi propio aprendizaje intensivo, y también espero proporcionar una ruta de aprendizaje más sistemática basada en la experiencia personal. Las cosas gratis requieren más lanzamiento. Los desvíos son esenciales y no todos los cursos son adecuados para todos. , todos tiene sus propios conceptos básicos, adecuados para diferentes niveles de cursos, cursos intensivos de teoría de aprendizaje basados ​​en 0. Personalmente recomiendo el curso del Sr. Wang Shusen, el curso de David Silver está en inglés, no es muy amigable, de hecho, leí mucho cuando entré en el pit, no se moleste con el aprendizaje intensivo de python, Xu Zhiqin de la Universidad Jiaotong de Beijing, la Facultad de Control Óptimo e Inteligencia de Datos de la Universidad de Ciencia y Tecnología del Suroeste, Tang Yudi, también leyó algunas publicaciones sobre Zhihu, como el aprendizaje intensivo vernáculo, algunos de los anteriores son más prácticos, algunos de ellos son pura teoría, y los videos se pueden encontrar en bilibili. Personalmente, creo que la teoría más fácil de entender es el curso de aprendizaje intensivo del Sr. Wang Shusen . Se recomienda para ver y entender repetidamente. También lo vi varias veces antes de entender. El principio de DDPG puede ayudarlo a comprender documentos relacionados.

Práctico

Después de dominar la teoría, debe consolidarse con el código. Personalmente, sugiero dominar primero las herramientas. Tensorflow tiene la versión 1.0 y la versión 2.0. Algunos de los códigos descargados de Internet son la versión 1.0 y otros son la versión 2.0. El tensorflow tutorial aquí personalmente recomienda geek tensorflow1.0 [Universidad de Pekín] Tensorflow2.0 , estos dos son muy amigables para los novatos, familiarizados con algunas variables, operaciones, visualización de tensorboard, etc. (el último blog es el contenido relevante del curso). Después de tener cierta base, a continuación recomiendo el Aprendizaje intensivo vernáculo de Zhihu , la dirección del código relevante RLcode . La combinación de teoría y herramientas puede básicamente comprender estos códigos y profundizarlos repetidamente. A continuación, recomiendo el aprendizaje por refuerzo de Python de Mo Fan, [Mo Fan Python] Aprendizaje por refuerzo de aprendizaje intensivo , aunque puede buscar esto al principio, pero no se recomienda verlo al principio, el video es corto y conciso, no adecuado para aquellos que no tienen compañeros de clase básicos, después de comprender la teoría del Sr. Wang Shusen, será muy claro ver el video de explicación del código de Mofan.

resumen

El enlace de secuencia del curso, ¡espero que pueda ayudarlo, luchar contra monstruos y mejorar en el campo del aprendizaje por refuerzo! ! !

Supongo que te gusta

Origin blog.csdn.net/weixin_43835470/article/details/120876613
Recomendado
Clasificación