GMM虽然给出的结果是隐变量属于各个cluster的概率,但是GMM模型仍然是认为每个样本就是只属于某一个cluster。GMM模型的原理就是认为每个样本都是由一个正态分布产生的。
与GMM不同,LDA是一种mixed membership model,对样本的每个维度都产生属于各个cluster的概率,即认为这个样本本身就是同时属于多个cluster的(因为各个维度里有属于不同cluster的)
LDA用于主题分析,不同于聚类。
GMM虽然给出的结果是隐变量属于各个cluster的概率,但是GMM模型仍然是认为每个样本就是只属于某一个cluster。GMM模型的原理就是认为每个样本都是由一个正态分布产生的。
与GMM不同,LDA是一种mixed membership model,对样本的每个维度都产生属于各个cluster的概率,即认为这个样本本身就是同时属于多个cluster的(因为各个维度里有属于不同cluster的)
LDA用于主题分析,不同于聚类。