机器学习基石（林轩田）第十一章笔记与感悟总结 - 代码天地

机器学习基石（林轩田）第十一章笔记与感悟总结

其他 2018-05-29 14:17:20 阅读次数: 1

11.1 Linear Models for Classification - Binary Classification

stochastic 随机的

linear classification是一个NP hard问题，因此如何找到一种方法，能够使相对容易的linear regression 和 logistics regression 来帮助求解linear classification，就比较有意义了。

我们想将error function稍稍整合一下，串起来。

对于linear classification而言，我们又两个动作，一是求出H，而是看err怎么样

我们用来表示，其中s是打分，y是真实的分类。

因为y只有正负1取值的可能。

因此实际上的推导过程中，左右两侧同乘y，进行形式变换。

其中ys的物理意义是，y是正确的，s是打分，故相乘总体代表了correctness score

我们对logistics regression进行了缩放，目的是为了将其正好在（0,1）上相切。

最后能够证明，只要我们将logistic regression / linear classification做的很好，那么我们也能够将linear classification 做的很好。

因为linear regression的在两侧的变化实在是太大，因此往往只是用来做初始值的设置。

11.2 Linear Models for Classification - Stochastic Grad. Descent

PLA每一轮只需要看一个点，是否正确来进行模型的修正，故时间复杂度为O（1）。

logistic regression是要每一轮，要遍历所有的数据后再处理，故要花O（N）的时间复杂度。

我们想让logistics regression 和PLA一样的快！！！

我们看到logistics regression 的梯度方向是计算了所有的点。我们不想计算所有的点，只想计算一个点就足够了。

技术性手段，将用随机抽样的方法来进行替换。我们只抽取一个数据，用他来代替总体的平均。

这个数据叫做随机梯度。

随机梯度可以看成是真实的梯度方向和噪音方向的加权和。

随机梯度的好处在于简单并且耗费低，适用于大数据和在线学习、

坏处是不稳定。

yita 是一种经验值，一般选择为0.1。

11.3 Linear Models for Classification - Stochastic Grad. Descent

我们如何从是非题变成多类别的选择题？

比如我们做四个类别的辨识。

思路是不断的进行二分类。

但是有不好的地方。

例如上面的三角两边都说是自己。

中间的正方形区域都说不是自己。

我们想用逻辑回归方式，用可能性来度量。

注意最后的是灰色的是logistics 函数，是一个单调的，再求最大值的时候可以不用经过这一步。

OVA，一个类别对其他所有类别的一种。把多类别的问题变成了多个二分类的问题。

好处：很有效率，很快，应用广。

坏处：类别太多，100个类别，我们把o当成一个类别，其他全是x的话，很容易造成logistics regression选择全部认为是x，这种情况的发生。

延伸：将会讲一些方法克服这些问题。

11.4 Linear Models for Classification - Multiclass via Binary

我们想的是，两个两个的比较，不要1和其他比较。4个不同的，两两比较总共比较6次。

但是我们如何知道那些重叠区域，到底属于啥呢？

回答是用投票的方式选择最有可能，属于哪一个类。

OVO，一对一的比较、

优点：很有效率，虽然比较次数多，但是每轮比较的少。同时应用比较广泛。

坏处：存储空间会加多。会变慢

猜你喜欢

转载自blog.csdn.net/jason__liang/article/details/80464193

机器学习基石（林轩田）第十一章笔记与感悟总结

机器学习基石（林轩田）第一章笔记与感悟总结

机器学习基石（林轩田）第十三章笔记与感悟总结

机器学习基石（林轩田）第十二章笔记与感悟总结

机器学习基石（林轩田）第十五章笔记与感悟总结

机器学习基石（林轩田）第六章笔记与感悟总结

机器学习基石（林轩田）第五章笔记与感悟总结

机器学习基石（林轩田）第四章笔记与感悟总结

机器学习基石（林轩田）第三章笔记与感悟总结

机器学习基石（林轩田）第十四章笔记与感悟总结

机器学习基石（林轩田）第十章笔记与感悟总结

机器学习基石（林轩田）第九章笔记与感悟总结

机器学习基石（林轩田）第八章笔记与感悟总结

机器学习基石（林轩田）第七章笔记与感悟总结

机器学习基石（林轩田）第二章笔记与感悟总结

林轩田机器学习基石笔记（第10-13节）——机器学习的分类

机器学习基石(林轩田)学习笔记

机器学习基石-林轩田-课程总结

《机器学习基石》——林轩田（笔记一）

机器学习基石-林轩田第五讲笔记

林轩田机器学习基石笔记（第9节）——Pocket AIgorithm（口袋算法）

林轩田机器学习基石笔记（第8节）——PLA循环停止条件的探讨

林轩田机器学习基石笔记（第7节）——PLA算法

林轩田机器学习基石笔记（第4节）

林轩田机器学习基石笔记（第1节）

林轩田机器学习基石课程个人笔记-第十讲

林轩田机器学习基石笔记（第16节）——概率论与机器学习建立连接

林轩田机器学习基石笔记（第18-19节）——把无限hypothesis变为有限

林轩田机器学习基石 - 学习笔记4 - 机器学习的可行性

林轩田《机器学习基石》资源汇总（视频+学习笔记+书）

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

curl的POST请求，封装方法

8.1.1. Integer Types

Java基础 Day05(个人复习整理)

Python - Django - 中间件 process_exception

小L的试卷

【Shell编程】（函数）判断用户是否存在

python(css样式)

spring ant path 匹配原则 - 【笔记】

《JavaScript与JScript从入门到精通》(美)James.Jaworski.中译本.扫描版.pdf

Eclipse运行带参数的java程序

每日归档

更多

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)