深度学习(花书)学习笔记——第十七章 蒙特卡罗方法

这个方法最初见到就是alpha go中使用的,后面会有专门介绍alpha go的文章,这里预留一个链接的地方:

。。。。。。。。。。

随机算法粗略的分为两类:拉斯Vegas 和蒙特卡罗算法,前者代表精确算法,后者代表近似算法。名字的由来大概都是和赌场有关。

采样和蒙特卡罗方法

这里主要介绍采样的必要性和蒙特卡罗方法的合理性。

重要采样

通过在最优条件下的采样

马尔科夫链蒙特卡罗方法

类似拓扑排序的方式,从一端不断采样至结束,同时分布式采样。就是一个不断磨合的过程,通过多次的概率运算得到。最终期望保留最高的概率值。这里有个疑问,为什么不在运行了数次后,直接取当前概率最高的值,设置其为1

Gibbs采样

同时采样的一个技术,只要条件独立的变量就可以同时采样

不同的峰值之间的混合挑战

不同峰值很难,可以通过回火的方式减少难度。

猜你喜欢

转载自blog.csdn.net/leichangqing/article/details/89020863