林轩田机器学习基石笔记（第8节）——PLA循环停止条件的探讨 - 代码天地

林轩田机器学习基石笔记（第8节）——PLA循环停止条件的探讨

其他 2018-08-19 12:53:54 阅读次数: 0

引言

第7节我们讨论了如何找到一条线把所有的圈圈叉叉都分在不同的两边，但是其实有一个隐含的大前提，那就是圈圈叉叉的分布必须是线性可分的，如下第1张图。如果是线性不可分那么，如下第2、3张图是无法用PLA算法把圈圈叉叉分开的。

本节课我们就讨论在线性可分的前提之下，PLA循环什么时候才能终止。

初步论证

我们知道，如果，那么代表W这条向量不符合我们的要求，那么如果现在出现一条线这样的线，那么就说明我们已经找到一条合适的线了，这条线把所有的圈圈叉叉都分在了不同的两边。据此，我们可以做一个推论：平面上的任何圈圈或者叉叉的点到这条线的最小距离都大于0，即。亦可以推论，任何一个之前犯错误的圈圈或叉叉到这条线的距离也大于0，且大于等于最小距离，即。

那现在我们要做一件事情，那就是我们找到的这条线Wt是否接近于我们想要的Wf。这里有一个数学知识，那就是衡量两个向量是否接近，就要把这两个向量做内积，内积越大说明越接近。

那么我们只要证明大于就好了！在第7节，我们知道W(t+1)其实就是W(t)+yX，如下图：

于是有如下推导：

又因为，所以代入以上式子得

又因为，所以存在，得证：

完整流程如下：

上面的论证还有问题，进一步论证

虽然我们证明了，说明了Wt和Wf的内积的确越来越大，说明两者越来越接近。但是这里我们并没有考虑向量长度的问题，如果两者长度很长，内积也会很大，所以接下来我们还要继续证明。

在第7节中，当我们找到一条错误的点X(即)，我们就会旋转更新W的角度，说明这个点到分割线的距离小于0，即

现在我们试着找到W(t)和W(t+1)之间的关系，首先我们队W(t+1)的绝对值（即长度）进行平方，根据下图：

我们知道W(t+1)=W+yX，那么可以推断，接着式子又可以转化为如下：

，又因为，所以

这说明W(t)的成长与中间的没有太大关系，而是靠标红色的成长。而表示任意犯错误的点，所以我们只要找到最远的一个点进行讨论，即。又因为yn是+1或者-1，平方后没有差别。

所以完整过程如下：

结论

前面我们证明了W(t)和W(t+1)的内积会越来越大，现在我们又证明了W(t)每次最多长，W(t)会慢慢的长。而两个向量的内积不可能无限的长，最大值只能为1，所以说明循环最终会停下来。他们的关系如下：

即，从W0开始，经过T次更新后，对Wf和Wt进行正规化向量，并进行内积操作，最终的结果大于等于其中代表更新次数的根号，constant是一个常数。

这里涉及到一个数学概念正规化向量，定义如下：

写到这里我懵逼了，但是不管怎么样这一节就是为了证明一点：PLA算法最终会停下来！

===========================懵逼分割线===========================

欢迎大家加入Q群讨论：463255841

===========================懵逼分割线===========================

猜你喜欢

转载自blog.csdn.net/zhangdongren/article/details/81545172

林轩田机器学习基石笔记（第8节）——PLA循环停止条件的探讨

林轩田机器学习基石笔记（第7节）——PLA算法

林轩田机器学习基石笔记（第10-13节）——机器学习的分类

林轩田机器学习基石笔记（第4节）

林轩田机器学习基石笔记（第1节）

林轩田机器学习基石笔记（第9节）——Pocket AIgorithm（口袋算法）

林轩田机器学习基石笔记（第16节）——概率论与机器学习建立连接

林轩田机器学习基石笔记（第18-19节）——把无限hypothesis变为有限

林轩田机器学习基石笔记（第15节）——霍夫丁不等式解决机器学习不可行的难题

林軒田机器学习基石笔记（第6节）

林轩田机器学习基石笔记（第17节）——有限多个hypothesis如何选到合适的g

【林轩田】机器学习基石（二）——PLA

林轩田机器学习基石笔记1—The Learning Problem

林轩田机器学习基石笔记3—Types of Learning

林轩田机器学习基石笔记4—Feasibility of Learning

机器学习基石(林轩田)学习笔记

林轩田机器学习基石作业1 PLA算法 15题 python2.7

《机器学习基石》——林轩田（笔记一）

机器学习基石-林轩田第五讲笔记

机器学习基石(林轩田)学习笔记:Lecture 8 & Lecture 9

【林轩田】机器学习基石（一）

[林轩田]机器学习基石（三）

[林轩田]机器学习基石（四)

机器学习基石（林轩田）第十五章笔记与感悟总结

机器学习基石（林轩田）第十一章笔记与感悟总结

机器学习基石（林轩田）第十三章笔记与感悟总结

机器学习基石（林轩田）第十二章笔记与感悟总结

林轩田机器学习基石课程个人笔记-第十讲

林轩田机器学习基石作业1 PLA算法 16-17题 python2.7

林轩田机器学习基石 - 学习笔记4 - 机器学习的可行性

今日推荐

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

【转】spring中对控制反转和依赖注入的理解

tms webcore 安装和使用

java程序员进阶相关书籍

SpringMVC接受请求参数、

如何保存训练好的机器学习模型

MyEclipse、Eclipse设置项目JDK的三个地方

商超行业微信小程序开发定制一般多少钱（行业技术人员解读）

Markdown编辑器语言——30分钟入门到到精通

Linux系统下MongoDB的简单安装与基本操作

Power Strings

每日归档

更多

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)