机器学习-采样

采样的作用

1 采样实现对随机现象的模拟,根据给定高的概率分布,模拟产生一个对应的随机事件。

2 采样也可以看做一种非参数模型,通过利用少数的采样点来近似总体分布,并刻画总体分布中的不确定性。

3 对当前数据进行重采样,可以充分利用已有数据集,挖掘更多信息,如自助法和刀切法。另外,利用重采样技术,可以在保持特定的信息下(目标信息不丢失),有意识的改变样本的分布,从而适应后续模型的训练与学习。

4 很多模型由于结构复杂、含有隐变量的原因导致对应的求解公式很复杂,没有显式解析解,难以进行精确求解或推理。可以使用采样方法进行随机模拟,从而对复杂模型进行近似求解或推理。一般转化为对某些函数在特定分布下的积分或者期望,或者求某些随机变量或参数在给定数据下的后验分布。

常见的采样方法

最基本的采样方法是均匀分布随机数:

一般采用线性同余法(LCG)生成离散均匀分布伪随机数,计算公式为 $x_{t+1} = (a \cdot x_t +c) \mod (m)$

猜你喜欢

转载自www.cnblogs.com/wzhao-cn/p/11303473.html