机器学习非监督分类之因子分析 - 代码天地

机器学习非监督分类之因子分析

其他 2018-08-20 05:57:37 阅读次数: 0

随机变量X是混合高斯分布时，我们采用EM算法可以解决，此时样本的数量是远大于特征数量的，当样本数量小于特征数量时，我们该如何建立模型呢？因子分析进入人们的视野。

假设数据是高斯分布，我们估计期望和方差：

由于样本数量小于特征数量，我们可以发现|∑| = 0，Σ是奇异矩阵，那么 Σ^-1 就不存在。但我们仍想使用高斯分布，那就需要对∑进行限制。

一、∑的限制

∑没限制之前，对角线上的元素为：

我们添加限制，∑不仅是对角线元素，且元素相等，Σ=σ²I，其中 σ² 是控制参数，σ^2为

^{只要m>2, ∑就是非奇异的。}

^{二、高斯的边缘和条件分布}

^{后面可能会用到高斯的边缘和条件分布，所以我们在这里简单介绍一下。}

^{假设有一个随机变量}

^{其中 x₁ 属于 r 维向量空间，x₁∈R^r，x₂∈R^s，x∈R^r+s，假设 x~N(μ,Σ)，其中}

E[x₁]=μ₁，Cov(x₁)=E[(x₁-μ₁)(x₁-μ₁)]=Σ11，所以

x1的高斯边缘分布x₁~N(μ₁,Σ₁₁)，x1|x2条件分布为x₁|x₂~N(μ_1|2,Σ_1|2)，所以

三、因子分析模型

我们假设（X，Z）是联合分布，其中Z是隐含变量，所以

其中Z是k维，向量 μ∈Rⁿ，矩阵 Λ∈R^n×k，对角矩阵 Ψ∈R^n×n，k 值通常是小于 n 的。我们假设数据xi是由k元高斯zi产生的，将它通过 μ+Λz^{(i)映射到n维，再加上噪音Ψ。}

因子分析模型如下：

（z,x）联合高斯分布为

x的期望

联合分布期望为

我们可得Σ_zz=Cov(z)=I

联合分布为

x的边缘分布为x~N(μ,ΛΛ^T+Ψ)，给定样本集 {x⁽ⁱ⁾;i=1,2,...,m}，我们能得到极大似然估计为

我们采用EM算法

四、求因子分析

EM算法第一步E求期望， Q_i(z⁽ⁱ⁾)=p(z⁽ⁱ⁾|x⁽ⁱ⁾;μ,Λ,Ψ)

由

我们可得到

即

我们可得到Qi（zi）为

第二部M算法最大化求参数

使最大化

上式可简化为

后面两项与参数无关，所以可以舍去，只留第一项，所以

对Λ求导可得

导数等于0，我们可以得到

我们得到

从 Q 是均值为 μ_z|x 协方差为 Σ_z|x 的高斯的定义可得：

第二式对于随机变量 Y，Cov(Y)=E[YY^T]-E[Y]E[Y]^T。

所以

我们通过求导也可以得到：

设置 Ψ_ii=Φ_ii。对角矩阵 Ψ 只包含对角元素 Φ。

五、优缺点：

优点：

缺点：

待补充

参考：

https://www.cnblogs.com/NaughtyBaby/p/5408643.html

猜你喜欢

转载自blog.csdn.net/fengziyihang/article/details/79876374

机器学习非监督分类之因子分析

机器学习非监督分类之主成分分析（PCA）

机器学习非监督之独立分析

机器学习-非监督分类算法之关联规则

机器学习非监督学习- kmeans算法

机器学习非监督学习- kmeans算法

数学建模之因子分析

机器学习（五）降维技术---主成分分析、因子分析

机器学习之监督学习：分类

基于机器学习的居民消费影响因子分析预测

因子分析

SAS 因子分析

基于ENVI的遥感影像的非监督分类

GEEer的快乐|是为了白嫖影像吧！分析挖掘，NDVI、非监督分类等

Google Earth Engine（GEE）——非监督分类案例分析（森林非森林核其它）

R语言学习记录：因子分析的R实现

因子分析 factor analysis (二 ) ：因子分析模型

MATLAB(2)--因子分析

SPSS因子分析案例

因子分析及R使用

因子分析（factor analysis)

R语言因子分析

R 语言因子分析

验证性因子分析

因子分析（R实例）

因子分析计算权重

回归模型的因子分析

Python进行因子分析

GIS实战应用案例100篇（四）-影像多种分类方法对比分析（非监督分类、监督分类、决策树分类）

机器学习之监督标题学习__线性分类

今日推荐

Linus “吃狗粮”最积极！

开源日报 | Winamp播放器即将开源；生成式AI之战升级第二轮；Linus“吃狗粮”最积极；AI进入泡沫前期；吴泳铭为阿里云带来了什么？

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

周排行

SVN服务端安装在阿里云

实战 | 相机标定

webpack核心概念

note20——》只要肯低头吃苦，人生就会有救

PAT甲级 1062 Talent and Virtue （25 分）排序

NG Toolset开发笔记--5GNR Resource Grid（26）

如何对待上司

oracle命令

第9章 STL迭代器

logstash使用es映射模板

每日归档

更多

2024-05-20(36)

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)