第九周 第二部分

多元高斯分布

x1 ,x2大概为线性关系,一些浅绿色的叉根据p(x1) *p(x2) 不太异常,但实际异常圆圈上的异常情况应该大致一致,但p(x1) *p(x2) 差异较大

那么,开发一种 改良版的异常检测算法 要用到一种 叫做多元高斯分布或者多元正态分布的东西

它能捕捉到一些之前的算法检测不出来的异常

多元高斯分布的参数 包括向量 µ 和一个 n×n 矩阵 Σ 被称为协方差矩阵
Σ 的行列式 (determinant) 它是一个矩阵的数学函数    

 

改变协方差矩阵 非对角线上的元素 你会得到一种不同的高斯分布
所以当我将非对角线的元素 所以当我将非对角线的元素 从 0.5 增加到 0.8 时
我会得到一个 更加窄和高的 沿着 x=y 这条线的分布 然后这个等高线图告诉我们 x 和 y 看起来是 一起增加的 概率高的地方是这样的 要么 x1 很大 x2 也很大 或者 x1 很小 x2 也很小
或者是这两者之间 然后随着这个值 0.8 增大 你会得到这样一个高斯分布 差不多全部的概率 都在一个很窄的范围内
也就是 x 几乎等于 y 它是一个非常高 而且非常薄的分布 几乎完全在 x 非常接近于 y 的这样一个 非常窄的范围内

改变均值u:  改变峰值的位置,移动分布的中心

总结1


不同的图片 展示 多元高斯分布 所能描述的概率分布是什么样的
它最重要的优势 就是它可以让你 能够描述当两个特征变量之间 可能存在正相关 或者是负相关关系的情况

猜你喜欢

转载自www.cnblogs.com/tingtin/p/12234677.html
今日推荐