机器学习基石（林轩田）第六章笔记与感悟总结 - 代码天地

机器学习基石（林轩田）第六章笔记与感悟总结

其他 2018-05-29 14:17:21 阅读次数: 0

6.1 Theory of Generalization - Restriction of Break Point

机器学习领域机器是如何做到举一反三的本领的？ dichotomies 是二分类，即label只有（o，x）这种。

例如positive rays，意思是一侧全是正，另一侧全是负，而出现ox 这种情景时，则两个点的mh（2）=3，实现了小于2^2的目的。突破口是两个点，则k=2.

例如 2D perception，在四个点的时候，有突破口。

只有一个数据点，则只有1种。有两个数据点，最多有三种dichotomies。

当有三个点时，1 dichotomy，没有违反。随便找两个点，都不能产生四种不同的情形，即没有shatter。

通俗的讲。k=2，的shatter就是任意两个点，所有的组合情况都出现（oo，xx，ox，xo）。

同理，k=3，shatter就是不能同时出现8个点。

只要有k的话，说不定能让mH（N）也可能是一个多项式。

6.2 Theory of Generalization - Bounding Function - Basic Cases

我们看上限的函数，Bounding Function。是break point =k时（已知）时，最大的可能mH（N）值。

当k确认时，我们得到的一个序列中都不能出现类似k=2时的（oo，xx，ox，xo）的情形。

这样就不用对Hyposises（是positive intervals？等具体的形式）无关，只需要看B（N，3），

例如当k=1时，N去所有，都全为1，见第一列。因为只能出现全为正的情景。

而当K=N+1的那种情况，则说明break point 还要大于当前的点的数目，故值为2^N次。

而对角线的情况，则是减了一种情况，即 xxxxx…… 的情况。

注意，我们B（4,4）的值是15，然而对于2D perception而言，只有14种，故为严格小于。

6.3 Theory of Generalization - Bounding Function - Inductive

我们想通过建立B（4,3）和B（3，？）之间的联系。

算出的结果是11,。

我们得到了最后的结论，mH（N）在break point 存在的情况一下，一定不会超过poly（N）

应用：我们不知道2D perceptrons 的成长函数是多少，但是我们能够知道的是，它的上线一定是（1/6）*N^3+……

6.4 Theory of Generalization - A Pictorial Pr

我们能不能把成长函数直接带入解决？答：不能。我们只能得到如下图的第二个公式的版本。

我们接下里有三个步骤，来证明这三个多余的常数。

第一个问题难点在于：Ein有限，而Eout无限，平面上有无限多条线。

我们怎么让有限多个点来区分无限多条线？我们用D'（N个点）来取代Eout.

E'in和Eout很接近，假设今天有个坏事情发生，有很大的机会，Ein和E'in隔的很远。我们就以拿来用，就可以用E'in来替代Eout。1/2的系数是用来表示是大概率发生。

我们成功的将Eout换掉了。

我们要换成有限多种，我们在乎的坏事情都只需要D和D' 有关。

我们这个平面都是数据，坏事就是一团。union bound 则是认为坏事情没有重叠。而现在我们把几乎一样的坏事情归为一点。

我们已经有固定的H了，我们想知道两次的sampling的差别。我们怎么知道两次抽样的差别？

我们最后证明出了机器学习中常用的一种公式。

总结本章的内容，我们介绍了break point，并知道了B能限制mH，知道了B的上界是poly

并且用第四节证明了mH（N）能替代M

猜你喜欢

转载自blog.csdn.net/jason__liang/article/details/80441419

机器学习基石（林轩田）第六章笔记与感悟总结

机器学习基石（林轩田）第十四章笔记与感悟总结

机器学习基石（林轩田）第五章笔记与感悟总结

机器学习基石（林轩田）第四章笔记与感悟总结

机器学习基石（林轩田）第三章笔记与感悟总结

机器学习基石（林轩田）第二章笔记与感悟总结

机器学习基石（林轩田）第一章笔记与感悟总结

机器学习基石（林轩田）第十五章笔记与感悟总结

机器学习基石（林轩田）第十二章笔记与感悟总结

机器学习基石（林轩田）第十章笔记与感悟总结

机器学习基石（林轩田）第九章笔记与感悟总结

机器学习基石（林轩田）第八章笔记与感悟总结

机器学习基石（林轩田）第七章笔记与感悟总结

林轩田机器学习基石课程个人笔记-第六讲

机器学习基石（林轩田）第十三章笔记与感悟总结

机器学习基石（林轩田）第十一章笔记与感悟总结

机器学习基石(林轩田)学习笔记

机器学习基石-林轩田-课程总结

《机器学习基石》——林轩田（笔记一）

机器学习基石-林轩田第五讲笔记

林轩田机器学习基石 - 学习笔记4 - 机器学习的可行性

林轩田机器学习基石笔记（第10-13节）——机器学习的分类

林轩田《机器学习基石》资源汇总（视频+学习笔记+书）

机器学习基石(林轩田)学习笔记:Lecture 4 & Lecture 5

机器学习基石(林轩田)学习笔记:Lecture 10 & Lecture 11

机器学习基石(林轩田)学习笔记:Lecture 6 & Lecture 7

机器学习基石(林轩田)学习笔记:Lecture 14 & Lecture 15

机器学习基石(林轩田)学习笔记:Lecture 8 & Lecture 9

机器学习基石(林轩田)学习笔记:Lecture 12 & Lecture 13

林轩田机器学习基石课程个人学习笔记-第五讲

今日推荐

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

周排行

计算机组成与设计（七）—— 除法器

Integer Approximation(分治+枚举)

大话数据库索引

windows10系统JDK的配置及下载地址

mysql实现秒值转换中原六仔平台搭建

Codeforces Round #556 (Div. 1)

百练1064 网线主管

Codeforces 995F Cowmpany Cowmpensation

子集生成之增量构造法，位向量法，二进制法

ERROR: cmd.exe failed with args /c "/APK\gradle\rungradle.bat...

每日归档

更多

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)