PCA主成分分析--应用

个人理解:

  PCA是进行降维用的。比如:

    检测n个样本的m个基因的表达值,用m个基因的表达值描述这n个样本。即m是属性。

    但是,我用m维度的数据(也叫变量)去描述、区分这n个样本,太复杂了。我想用3个特征来区分这n个样本。比如:给出3个特征,有90%的样本在这3个特征上都不同。这3个特征就是PC1,PC2和PC3(也叫:主要特征、关键特征、主要变量)。

    一般情况下,并不能直接找出这样的主要特征。这时,我们可以用原有维度数据的线性组合(即PC1,PC2,PC3)来表示事物(n个样本)的主要特征, PCA 就是这样一种分析方法。

    参考:https://www.biomart.cn/experiment/430/590/597/58034.htm在基因表达数据分析中,使用PCA。

 

  总结:这个总结,真是太好了:

    PCA是一种著名的数据降维算法,它应用的条件是数据/特征之间具有明显的线性相关性,它的两个主要的指导思想是抓主要矛盾和方差即信息,它的基本应用是数据降维,以此为基础还有数据可视化、数据压缩存储、异常检测、特征匹配与距离计算等。从数学上理解,它是一种矩阵分解算法;从物理意义上理解,它是线性空间上的线性变换。
    ————————————————
    版权声明:本文为CSDN博主「Chen_Tianyang」的原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接及本声明。
    原文链接:https://blog.csdn.net/ctyqy2015301200079/java/article/details/85325125

  我的问题:对于两个样本的差异表达基因,能够做PCA分析呢?

  

猜你喜欢

转载自www.cnblogs.com/zypiner/p/12627505.html