增强学习(强化学习)基础之马尔科夫决策过程

https://zhuanlan.zhihu.com/p/28084942
这位知乎的博主是根据David Silver的课件讲的。我认为讲得比较清楚。可以参考

猜你喜欢

转载自blog.csdn.net/hai008007/article/details/80286978