[Principios de aprendizaje de refuerzo + Columna de proyectos] Serie imperdible: principios de algoritmos de un solo agente y múltiples agentes + práctica de proyectos, habilidades relacionadas (ajuste de parámetros, dibujo, etc., realización de proyectos interesantes, realización de proyectos de aplicación académica
El plan para el aprendizaje de refuerzo profundo es:
- Enseñanza básica de algoritmos de inteligencia única (basada en el entorno del gimnasio)
- Enseñanza convencional de algoritmos de inteligencia múltiple (basada en el entorno del gimnasio)
- Algunos proyectos interesantes (Super Mario, backgammon, Fight the Landlord, varias aplicaciones de juegos)
- Combate real de preguntas de inteligencia única e inteligencia múltiple (el documento reproduce negocios parciales como: programación de optimización de UAV, programación de recursos de energía y otras aplicaciones de proyectos)
Esta columna es principalmente para ayudar a los estudiantes de nivel de entrada a comprender rápidamente los principios del algoritmo de agente único | multiagente + práctica del proyecto de aprendizaje por refuerzo. En el seguimiento, continuaremos analizando los principios de conocimiento involucrados en el aprendizaje profundo para todos, para que todos puedan reservar conocimiento mientras practican el proyecto, sabiendo qué es, por qué es y sabiendo por qué para saber por qué es. <