【机器学习笔记二】----Learning to answer Yes or No（解决二分类问题） - 代码天地

【机器学习笔记二】----Learning to answer Yes or No（解决二分类问题）

其他 2018-09-05 00:11:15 阅读次数: 0

perceptron hypothesis set

以信用卡发放为例，对顾客的相关特征信息进行收集，

数据集示例如下：

对每一个特征赋予一个权重，计算所有特征的加权，然后和已定义的阈值threshold进行比较，查看两者之间的大小关系

简化：将门槛值threshold转换为（ $w_{0}=-threshold,x_{0}=+1$ ）

二维平面中的感知器：每个h对应平面上的一条直线，每条线会有不同的预测，perceptrons<=>linear(binary) classifiers，所以对于同一个点，使用不同的直线会产生不同的预测结果。

Perceptron Learning Aigotithm(PLA) 感知器学习算法

设置演算法在hypothesis H 中选择最好的 g，达到理想的 $g(x_{n})=f(x_{n})=y_{n}$ ,但是困难的是H中hypothesis的个数无限，所以使用一个普通的直线基于数据集的错误分类不断进行修正。

扫描二维码关注公众号，回复： 3057597 查看本文章

使用权重向量 $w_{0}$ 代表 $g_{0}$ ，设置所有的w都为0，对于给定的直线 $w_{t}$ ，找到使用此直线分类错误的点并使用公式 $w_{t+1}=w_{t}+y_{n(t)}x_{n(t)}$ 进行修正，

实际y=+1，但分类为-1，即w和x的角度太大，使用 $w_{t+1}=w_{t}+x_{n(t)}$

实际y=-1，但分类为+1，即w和x之间的角度太小， $w_{t+1}=w_{t}-x_{n(t)}$

一直循环，直到没有错误的分类点（知错能改）

怎样判断还有没有错误？cyclic PLA，例如从1-100，依次查看是否有错，有则修正，没有则继续

算法一定会停下吗？

（在对分类错误的点进行修正的时候，可能会使分类正确的点变成分类错误的点）

algorithmic:halt(no mistake)

Linear Separability 线性可分可以找到一条直线将其分类

假设是线性可分的情况，算法是否能停下来？

假设 $w_{f}$ 为理想的直线，则 $\min_{n}y_{n}w_{f}^{T}x_{n}$ 为最接近理想直线的线，则使用 $w_{f}$ 存在对每一个点 $x_{n}$

使用 $w_{f}^{T}w_{t}$ 相乘，对于任何一个 $（x_{n(t)},y_{n(t)}）$ $\left (x_{n(t)},y_{n(t)} \right )$ , $w_{f}^{T}w_{t}$ 內积会越来越大，角度越来越靠近，但是可能不是角度的关系，而是长度的关系。

$w_{t}$ 只有出错的时候才会更新。

查看更新向量的长度变化：向量的增长会有限

从 $w_{0}=0$ 开始，进行T次修正后，因为长度的增长会有限，而內积正规化后最大为1，所以 $w_{f}$ 和 $w_{t}$ 会越来越接近，最终会停下来。

Non Separable Data

针对线性可分的情况，PLA为什么会停下来：

1、因为线性可分则 $w_{f}$ 和 $w_{t}$ 会越来越接近
2、 $w_{t}$ 的长度会缓慢增长

PLA好处：实现简单，快速，可以工作在任何维度

PLA坏处：需要预先假设数据集是线性可分的，但是不能确定PLA需要多久能停下来

数据中可能有噪音，假设噪音很小，通常 $y_{n}=f(x_{n})$ ，找到一条线使得在data上犯得错误最小

pocket algorithm

修正PLA算法使用保留口袋中最好的w，在修正时比较修正的直线和当前直线哪一个犯错少，使用犯错少的进行替代。

口袋算法比PLA相比较慢。

猜你喜欢

转载自blog.csdn.net/m0_38103546/article/details/82215220

【机器学习笔记二】----Learning to answer Yes or No（解决二分类问题）

台大林轩田机器学习基石学习笔记（二）：Learning to Answer Yes/No

02 Learning to Answer Yes/No

机器学习基石笔记 Lecture 2: Learning to Answer Yes/No

机器学习基石 Lecture2: Learning to Answer Yes/No

机器学习基石——Lecture 2：Learning to Answer Yes/No

林轩田机器学习基石2：学习回答Yes/No（Learning to Answer Yes/No）

台湾大学林轩田机器学习基石课程学习笔记2 -- Learning to Answer Yes/No

Machine Learning Foundations 笔记：1-2 Learning to answer Yes/No

2）机器学习基石笔记Lecture2:Learning to Answer Yes/No

机器学习基石笔记：02 Learning to Answer Yes/No、PLA、PA

【台大林轩田《机器学习基石》笔记】Lecture 2——Learning to Answer Yes/No

台湾大学林轩田机器学习基石课程学习笔记2--Learning to Answer Yes/No

机器学习基石（台湾大学林轩田），Lecture 2: Learning to Answer Yes/No

How to answer 'yes' in bash Script

二分类器解决多分类问题

机器学习二（二分类问题）

神经网络解决二分类问题

二分类问题

[DataAnalysis]机器学习中如何用二分类学习器解决多分类问题

【火炉炼AI】机器学习008-用简单线性分类器解决二分类问题

【火炉炼AI】机器学习008-简单线性分类器解决二分类问题

ICPC China Nanchang National -- Max answer（ST表+前后缀+线段树+二分）

2019 Multi-University Training Contest 3 Find the answer （离散化+二分+树状数组）

电影评论分类：二分类问题

成功解决IMDB电影二分类问题中数据集无法加载的问题

【机器学习】：利用二分类解决多分类

二分类

简单神经网络解决二分类问题示例（Tensorflow）

使用logistic 回归解决良性、恶性肿瘤的二分类问题

今日推荐

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

周排行

计算机组成与设计（七）—— 除法器

Integer Approximation(分治+枚举)

大话数据库索引

windows10系统JDK的配置及下载地址

mysql实现秒值转换中原六仔平台搭建

Codeforces Round #556 (Div. 1)

百练1064 网线主管

Codeforces 995F Cowmpany Cowmpensation

子集生成之增量构造法，位向量法，二进制法

ERROR: cmd.exe failed with args /c "/APK\gradle\rungradle.bat...

每日归档

更多

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)