La inteligencia artificial es una de las tecnologías más excitante en el siglo 21. La inteligencia artificial, destinado a crear la inteligencia parecida a la humana y la inteligencia humana, incluyendo la percepción, la toma de decisiones y cognitiva (de la intuición para el razonamiento, la planificación, la conciencia, etc.). Entre ellos, la determinación percepción de lo que, el aprendizaje profundo ha ido más allá del nivel humano; decisiones para resolver cómo, aprendizaje por refuerzo logró cierto éxito en el campo de juego y la robótica; cognitiva resolver es estudiar por qué, el conocimiento de mapeo, el razonamiento causal y el aprendizaje continuo. aprendizaje por refuerzo, el aprendizaje a través de la secuencia de votaciones de decisiones para resolver el problema, y por lo tanto debe ser el acceso universal a la última clave de la inteligencia artificial.
Cursos y vídeo
Refuerzo de Aprendizaje de David de plata (2015) [página web] [youtube] [bilibili]
CS 188: Introducción a la Inteligencia Artificial [Otoño 2012-Primavera 2014] [Otoño 2018] [Verano 2019] [Primavera 2020]
CS 294: Deep aprendizaje por refuerzo por Sergey Levine [Otoño 2015] [Primavera 2017] [Otoño 2017] [Otoño 2018]
CS 285: Deep aprendizaje por refuerzo [Otoño 2019] [youtube]
Avanzada profundo aprendizaje y aprendizaje por refuerzo por DeepMind y UCL [youtube2018]
Profundo Refuerzo de aprendizaje y de control [Primavera 2017]
CS234: aprendizaje por refuerzo [Invierno 2019] [youtube]
Profundo RL Bootcamp [de agosto de 2,017]
Profundo Refuerzo de aprendizaje por李宏毅[Primavera 2018] [yourube2018]
Refuerzo de aprendizaje por莫烦[página web]
libros
Refuerzo de aprendizaje: Una introducción (primera edición, 1998) [página web]
Refuerzo de aprendizaje: Una introducción (2ª edición, 2018) [página web] [bookdraft2018jan1] [2018] [Código Python] [中文翻译]
Hands-On aprendizaje por refuerzo con Python (2018) [página web]
Refuerzo de aprendizaje con abierto AI TensorFlow y Keras Usando Python (2018) [página web]
Algoritmos de aprendizaje por refuerzo (2010) [descargar]
"Las redes neuronales y el aprendizaje profundo" [Descargar]
código
ShangtongZhang / Python Aplicación de Refuerzo de aprendizaje: Una introducción (segunda edición) [github]
berkeleydeeprlcourse [github]
tensorlayer / RLzoo github
rlcode / refuerzo de aprendizaje [github]
MorvanZhou / Refuerzo de aprendizaje-con-tensorflow [GitHub]
dennybritz / refuerzo de aprendizaje [github]
curso
Girando OpenAI [Inglés] [Versión en chino]
discurso
Rica Sutton, 2015, Introducción al aprendizaje por refuerzo con aproximación de funciones
Andrew Barto, 2018, Una historia de aprendizaje por refuerzo
David Silver, Principios de Deep RL
Benjamin Recht, 2018, optimización Perspectivas en el aprendizaje del control
John Schulman, 2017, Las tuercas y pernos de profundo aprendizaje por refuerzo de Investigación
Joelle Pineau, Introducción a Refuerzo de aprendizaje
Profundo aprendizaje y la Escuela de Verano aprendizaje por refuerzo, 2018, 2017
Escuela profunda Aprendizaje de Verano, 2016, 2015
Yisong Yue y Hoang M. Le, imitación de aprendizaje , ICML 2018 Tutorial
visión de conjunto
Li, Y. (2017). Profundo Refuerzo de aprendizaje: una visión general. ArXiv. [papel]
Littman, ML (2015). Aprendizaje por refuerzo mejora el comportamiento de la retroalimentación evaluativa. Naturaleza, 521: 445-451. [papel]
Kaelbling, L., Littman, M., y Moore, A. (1996). Aprendizaje por refuerzo: Un survey.Journalof Investigación en Inteligencia Artificial, 4: 237-285. [papel]
algoritmo
medio ambiente
Gimnasio OpenAI
Google dopamina 2.0
emotivo Todorov Mujoco
rejilla común entorno de clase mundial
marco
Las líneas de base OpenAI
Baidu PARL
DeepMind OpenSpiel
investigador
Richard S. Sutton [página web]
David Silver [página web]
Pieter Abbeel [página web]
Sergey Levine [página web]
李宏毅[página web]
Conferencia / diario
会议: AAAI, PELLIZCOS, ICML, ICLR, IJCAI, AAMAS, IROS 等.
Diario: AI, JMLR, JAIR, Machine Learning, JAAMAS y así sucesivamente.
instituto de investigación
OpenAI
DeepMind
Berkeley Investigación en Inteligencia Artificial (BAIR) Lab
Blog
Keavnn'Blog
Medio: Refuerzo de aprendizaje
StackOverflow: Refuerzo de aprendizaje
conocer casi
refuerzo conferencia conocimiento aprendizaje
unidad de inteligencia
aprendizaje por refuerzo
sin pública
La profundidad de laboratorio de aprendizaje por refuerzo
aprendizaje profundo vanguardia de la tecnología
AI Technology Review
Nueva Ji-won
otro
kmario23 / deep-learning-llovizna [GitHub] [página web]
Mr.Jk.Zhang [CSDN]