这个方法最初见到就是alpha go中使用的,后面会有专门介绍alpha go的文章,这里预留一个链接的地方:
。。。。。。。。。。
随机算法粗略的分为两类:拉斯Vegas 和蒙特卡罗算法,前者代表精确算法,后者代表近似算法。名字的由来大概都是和赌场有关。
采样和蒙特卡罗方法
这里主要介绍采样的必要性和蒙特卡罗方法的合理性。
重要采样
通过在最优条件下的采样
马尔科夫链蒙特卡罗方法
类似拓扑排序的方式,从一端不断采样至结束,同时分布式采样。就是一个不断磨合的过程,通过多次的概率运算得到。最终期望保留最高的概率值。这里有个疑问,为什么不在运行了数次后,直接取当前概率最高的值,设置其为1
Gibbs采样
同时采样的一个技术,只要条件独立的变量就可以同时采样
不同的峰值之间的混合挑战
不同峰值很难,可以通过回火的方式减少难度。