Zusammenstellung von Einführungsmaterialien zum Reinforcement Learning

Lassen Sie uns zunächst einige Referenzmaterialien sortieren und später spezifische Inhalte hinzufügen.

Referenzmaterialien
[1] Grundlegende Konzepte des verstärkenden Lernens
[2] < a i =4>Wie versteht man den Zustandswert und den Aktionswert beim Verstärkungslernen? [3] Verstärkendes Lernen丨Zeitdifferenzalgorithmus TD(0) und zugehörige Programmiersimulation [4] Reinforcement Learning – Deep Q Network (DQN) [5] Reinforcement Learning – Prinzip des Q-Learning-AlgorithmusVerstärkendes Lernen (5), gelöst durch die Zeitdifferenzmethode (TD)



おすすめ

転載: blog.csdn.net/u010072043/article/details/131069894