机器学习与数据挖掘第二讲机器学习分类与可能性 - 代码天地

机器学习与数据挖掘第二讲机器学习分类与可能性

其他 2019-06-15 02:22:39 阅读次数: 0

版权声明：该文章来自leeningzzu https://blog.csdn.net/leeningzzu/article/details/88071371

第二讲机器学习分类与可能性

分类

目前多按照数据标记分类

输出空间

二元分类
多元分类（离散为分类）
回归分析（连续为回归）
结构化学习

数据标记

监督
非监督
半监督
增强学习（反馈是关键）

目标函数

Batch 填鸭式
online 老师教学
active 主动问题

机器学习的可能性

重点关注预测未知数据的能力，即泛化能力的本质

Hoeffding‘s inequality $P[|\nu-\mu|>\epsilon]\leq2exp({-2}\epsilon^{2}N)$
当抽样样本 $N$ 足够大或者容忍限度 $\epsilon$ 宽松时， $\nu=\mu$ 在概率上几乎正确(probably approximately correct,PAC).其背后的实质是大数定律，所以当样本足够大时可从样本数据推算全局。
通过对数据集的训练，我们默认从假设集合中挑选表现最好的假设 $\Rightarrow g=f$ ,但表现好一定具有很好的泛化能力么？这么选择是否有依据？毕竟存在表现佳但泛化能力差的可能。
当数据集足够大时, $E_{in}$ 与 $E_{out}$ 表现差别大的概率很小 $P[|E_{in}-E_{out}|>\epsilon]\leq2Me^{{-2}\epsilon^{2}N}$ .所以每次选择表现最好的假设其泛化能力越强的可能性高，选择具有合理性。

从统计学随机抽样代表性角度类比：
在大的样本空间中随机抽样，可能存在样本对总体代表性不佳的可能，但在大数定律下，该事件属于小概率事件，即选择到代表性差的样本可行性低。
所以当 $N$ 足够大时，即便进行一次随机抽样，我们认为所得样本可较好的代表总体特征（小概率事件不可能定理）。

猜你喜欢

转载自blog.csdn.net/leeningzzu/article/details/88071371

机器学习与数据挖掘第二讲机器学习分类与可能性

ptyhon 学习第二讲

机器学习和数据挖掘第五讲训练与测试

机器学习与数据挖掘第三讲线性模型

机器学习与数据挖掘第十二讲：Regularization

机器学习与数据挖掘第十讲：神经网络

【sklearn第二讲】基于sklearn的机器学习

机器学习数据挖掘

数据挖掘与机器学习

【数据挖掘、机器学习】

机器学习与数据挖掘-作业二-第二章模型评估与选择

读《数据挖掘-实用机器学习技术》笔记（二）

【机器学习笔记四】-----Feasibility of learning（机器学习的可能性）

机器学习 | 基于机器学习的银行电话营销客户购买可能性预测分析

机器学习 | 基于机器学习的推荐系统客户购买可能性预测分析

【精】elasticsearch学习与实践（第二讲）

Pytorch学习第二讲：网络创建

第二讲：生成学习算法

Django学习-第二讲 DjangoURL与视图

【机器学习】数据挖掘算法——关联规则（二），挖掘过程，Aprioir算法

数据挖掘学习（二）——分类

数据挖掘和机器学习

机器学习与数据挖掘简介

Python 数据挖掘与机器学习

Python数据挖掘与机器学习

Stanford机器学习---第二讲. 多变量线性回归 Linear Regression with multiple variable Stanford机器学习---第二讲. 多变量线性回归 Linear Regression with multiple variable

Python深度学习第二讲——数据增广

机器学习与数据挖掘第四讲误差和噪声

机器学习与数据挖掘第一讲定义与PLA算法

原机器学习与数据挖掘第九讲：线性模型2

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

循环神经网络（rnn）讲解

Tigao教程四：单独的关节运动

金蝶K3WISE15.0-注册套打教程

如何在Mac上配置Kubernetes

Android应用结束自身进程的方法

SpringMVC学习十三拦截器栈

中国驻洛杉矶总领馆举行新春招待会

HttpClient get post 发送

11 - three.js 笔记 - 绘制三维字体模型

Mysql递归获取某个父节点下面的所有子节点和子节点上的所有父节点

每日归档

更多

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)