统计学习基本分类

其他 2021-03-06 06:52:54 阅读次数: 0

文章目录

前言
一、监督学习
二、无监督学习
- 1.无监督学习的概念
- 2.无监督学习相关概念
三、强化学习
四、半监督学习与主动学习

前言

统计学习或机器学习一般包括监督学习、无监督学习、强化学习，有时还包括半监督学习和主动学习。

一、监督学习

1.监督学习的概念

监督学习：指的是从标注数据中学习预测模型的机器学习问题，其本质就是学习输入到输出的映射的统计规律。

2.监督学习相关概念

输入空间：输入的所有可能取值的集合
实例：每一个具体的输入，通常是由特征向量表示
特征空间：所有特征向量存在的空间
输出空间：输出的所有可能取值的集合

3.研究问题的分类

输入变量与输出变量均为连续变量的预测问题——回归问题
输出变量为有限个离散变量的预测问题——分类变量
输入变量与输出变量均为变量序列的预测问题——标注问题

4.符号表示

（1）符号表示

输入变量：X; 输入变量的取值：x
输出变量：Y; 输出变量的取值：y
输入实例x的特征向量表示：

这个表示x的几个特征
以xi表示多个输入变量中第i个变量
样本容量为N的训练集

(2)基本概念

监督学习的基本假设：X和Y具有联合概率分布P(X,Y)
监督学习的目的：学习一个输入到输出的映射，这一映射以模型表示
模型的形式：条件概率分布P(Y|X)或决策函数Y=f(X)
假设空间：所有这些可能模型的集合。
对具体的输入进行相应的输出预测时，表示为：P(y|x)或者y=f(x)

监督学习的流程图：
监督学习分为学习和预测两个过程

二、无监督学习

1.无监督学习的概念

无监督学习：指的是无标注数据中学习预测模型的机器学习问题，其本质是学习数据中的统计规律或潜在结构。
监督学习和无监督学习的对比：
在这里插入图片描述

2.无监督学习相关概念

输入空间: $\chi$
隐式结构空间： $\zeta$
模型:函数z=g(x),条件概率分布P（z|x）或条件概率分布P（x|z）
假设空间：所有这些可能模型的集合
目的：选出在给定评价标准下的最优模型
样本容量为N的训练集： $U =\{x_1,x_2，…，x_N\}$

三、强化学习

强化学习是指智能系统在与环境的连续互动中学习最优行为策略的机器学习问题。其本质就是学习最优的序贯决策。
在这里插入图片描述
相关概念：

S：有限状态集合
A：有些动作集合
P：状态转移概率函数P（ $s^·$ |s,a）=P(s $_t$ $_+$ $_1$ = $s^·$ |s $_t$ =s,a $_t$ =a)
r：奖励函数 r(s,a)=E(r $_t$ $_+$ $_1$ |s $_t$ =s,a $_t$ =a)
$\gamma$ ：衰减函数 $\gamma$ $\in$ $[0, 1]$

强化学习的目标就是在所有可能的策略中选出价值函数最大的策略 $\pi$ $^*$ ,在实际学习中往往从具体的策略出发，不断优化已有策略。

四、半监督学习与主动学习

半监督学习：是指利用标注数据和未标注数据学习预测模型的机器学习问题。通常是少量标注数据和大量未标注数据（降低成本）。本质就是利用未标注数据中的信息来辅助标注数据进行监督学习，以较低的成本达到较好的学习效果。
主动学习：是指机器学习不断主动给出实例让教师进行标注，然后利用标注数据学习预测模型的机器学习问题。通常给定的标注数据往往是随机得到的。主动学习的目的是找出对学习最有帮助的实例让教师标注，以较小的标注代价，达到较好的学习效果。

猜你喜欢

转载自blog.csdn.net/Txixi/article/details/112907807

统计学习基本分类

统计学习的分类

统计学习的基本概念和分类

统计学习方法——统计学习的分类

统计学习小笔记——分类篇

数据挖掘学习笔记：分类、统计学习【转载】

shell的基本分类

机器学习的基本分类和基本问题

《统计学》学习笔记之分类数据分析

统计学习方法之基本概念

前段统计学习

统计学习

统计学习15

统计学习14

统计学习11

统计学习4

统计学习16

权限管理基本分类

文本分类基本流程

machine learning _基本分类

编程语言的基本分类

SQL语句的基本分类

【学习笔记】统计学入门（3/7 ）——分类变量的统计描述

机器学习之文本分类-从词频统计到神经网络（二）

机器学习之文本分类-从词频统计到神经网络（一）

LIBSVM学习——文本分类

统计学习方法之统计学习概论

【统计学习方法】决策树 CART生成算法分类树 Python实现

《统计学习方法》

统计学习_____GMM模型

今日推荐

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

周排行

返回指定时间格式

fopen函数中的mode参数

Java 单例模式探讨

Flex remoteobject工作原理探讨

寻找mplayer的便捷安装方法

30天了解30种技术系列---(26)MySQL自动化运维工具Inception

关于Jboss/Tomcat/Jetty的JNDI定义123

程序减肥，strip，eu-strip 及其符号表

AsyncTask、View.post(Runnable)、ViewTreeObserver三种方式总结frame animation自动启动

Json和Bean的互相转换

每日归档

更多

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)