无监督学习概论 - 代码天地

无监督学习概论

其他 2020-04-07 09:20:49 阅读次数: 0

文章目录

1. 无监督学习基本原理
2. 基本问题

2.1 聚类 Clustering
2.2 降维 Dimensionality Reduction
2.3 概率模型估计

3. 机器学习三要素
4. 无监督学习方法

4.1 聚类
4.2 降维
4.3 话题分析
4.4 图分析

1. 无监督学习基本原理

机器学习或统计学习一般包括监督学习、无监督学习、强化学习

无监督学习：从无标注数据中学习模型的机器学习问题

无标注数据是自然得到的数据
模型表示数据的类别、转换或概率
本质：学习数据中的统计规律或潜在结构，主要包括聚类、降维、概率估计
基本想法：对给定数据（矩阵数据）进行某种“压缩”，找到数据的潜在结构，假定损失最小的压缩得到的结果就是最本质的结构
考虑发掘数据的纵向结构，对应聚类
考虑发掘数据的横向结构，对应降维
考虑发掘数据的纵向与横向结构，对应概率模型估计

2. 基本问题

2.1 聚类 Clustering

聚类是将样本集合中相似的样本（实例）分配到相同的类，不相似的样本分配到不同的类。

聚类分 硬聚类（一个样本只属于一个类）和 软聚类（一个样本可属于多个类）
聚类方法有层次聚类和 $k$ 均值聚类

2.2 降维 Dimensionality Reduction

降维是将样本集合中的样本（实例）从高维空间转换到低维空间。降维可以帮助发现数据中隐藏的横向结构

假设样本原本存在于低维空间，或近似地存在于低维空间，通过降维可以更好地表示样本数据的结构，更好地表示样本之间的关系

降维有线性降维和非线性降维，降维方法有主成分分析

在这里插入图片描述

2.3 概率模型估计

假设训练数据由一个概率模型生成，同时利用训练数据学习概率模型的结构和参数

概率模型包括混合模型、概率图模型等
概率图模型又包括有向图模型和无向图模型
概率模型估计可以帮助发现数据中隐藏的横向纵向结构

在这里插入图片描述

3. 机器学习三要素

同监督学习一样，无监督学习也有三要素：模型、策略、算法

模型就是函数 $z=g_\theta(x)$ ，条件概率分布 $P_\theta(z |x)$ ，或 $P_\theta(x|z)$ ，在聚类、降维、概率模型估计中拥有不同的形式

聚类中模型的输出是类别
降维中模型的输出是低维向量
概率模型估计中的模型可以是混合概率模型，也可以是有向概率图模型和无向概率图模型

策略在不同的问题中有不同的形式，但都可以表示为目标函数的优化

聚类中样本与所属类别中心距离的最小化
降维中样本从高维空间转换到低维空间过程中信息损失的最小化
概率模型估计中模型生成数据概率的最大化

算法通常是迭代算法，通过迭代达到目标函数的最优化，比如，梯度下降法。

层次聚类法、k均值聚类是硬聚类方法
高斯混合模型 EM算法是软聚类方法
主成分分析、潜在语义分析是降维方法
概率潜在语义分析、潜在狄利克雷分配是概率模型估计方法

4. 无监督学习方法

4.1 聚类

聚类主要用于数据分析，也可以用于监督学习的前处理

可以帮助发现数据中的统计规律
数据通常是连续变量表示的，也可以是离散变量表示的

4.2 降维

降维主要用于数据分析，也可以用于监督学习的前处理

可以帮助发现高维数据中的统计规律
数据是连续变量表示的

4.3 话题分析

话题分析是文本分析的一种技术

给定一个文本集合，话题分析旨在发现文本集合中每个文本的话题，而话题由单词的集合表示。
话题分析方法有 潜在语义分析、概率潜在语义分析、潜在狄利克雷分配

4.4 图分析

图分析的目的是 发掘隐藏在图中的统计规律或潜在结构

链接分析是图分析的一种，主要是发现有向图中的重要结点，包括 PageRank 算法
PageRank 算法最初是为互联网搜索而提出。将互联网看作是一个巨大的有向图，网页是结点，网页的超链接是有向边。PageRank 算法可以算出网页的 PageRank 值，表示其重要度，在搜索引擎的排序中网页的重要度起着重要作用

发布了818 篇原创文章 · 获赞 1750 · 访问量 40万+

他的留言板关注

猜你喜欢

转载自blog.csdn.net/qq_21201267/article/details/105351461

无监督学习概论

无监督学习

监督学习与无监督学习

监督学习，无监督学习，弱监督学习，无监督学习

无监督学习算法

图像~无监督学习

统计学习方法详解之第十三章无监督学习概论

监督学习与无监督学习的区别_机器学习

机器学习中的监督学习与无监督学习

机器学习：监督学习和无监督学习

机器学习-监督学习&&无监督学习

机器学习笔记---监督学习与无监督学习

机器学习（一）——监督学习与无监督学习

有监督学习、无监督学习

监督学习和无监督学习

有监督学习和无监督学习的区别

监督学习语无监督学习的区别

有监督学习和无监督学习

有监督学习与无监督学习

无监督学习和监督学习

有监督学习及无监督学习的区别

无监督学习和有监督学习区别

监督学习和无监督学习区别

无监督学习和监督学习的区别

2 监督学习 VS 无监督学习

监督学习和无监督学习的区别

监督学习与无监督学习的基本概念

有监督学习和无监督学习区别？

【无监督学习】0、有监督学习、无监督学习、半监督学习

机器学习：监督学习、无监督学习、半监督学习、强化学习

今日推荐

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

【转】spring中对控制反转和依赖注入的理解

tms webcore 安装和使用

java程序员进阶相关书籍

SpringMVC接受请求参数、

如何保存训练好的机器学习模型

MyEclipse、Eclipse设置项目JDK的三个地方

商超行业微信小程序开发定制一般多少钱（行业技术人员解读）

Markdown编辑器语言——30分钟入门到到精通

Linux系统下MongoDB的简单安装与基本操作

Power Strings

每日归档

更多

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)