吴恩达机器学习课笔记week 3 - 代码天地

吴恩达机器学习课笔记week 3

其他 2018-08-12 19:46:41 阅读次数: 0

本周主要讲分类、逻辑回归以及正则化

分类

分类问题的几个例子

判别一个邮件是/不是垃圾邮件
判别一个转账交易是/不是欺诈交易
判别肿瘤是恶性/良性
也就是说输出的y的取值是 $\{0,1\}$ ，0一般表示negative class，1表示positive class。对于多类别则是 $y\in\{0,1,2,3,...\}$ 。

线性回归解决这个分类问题会有什么问题？
如下图所示：
这里写图片描述
如果用线性回归的话，会出现假如样本点有一个离均值很远的点的情况下，这个点导致整个判别面发生巨大的改变。这里边最主要的一点就是线性回归的 $y=h_\theta(x)$ 可以＞1可以＜0。我们希望能够有一个方法使得 $0\leq y\leq1$ 。

逻辑回归的hypothesis representation

如下图所示：
这里写图片描述

我们在线性回归的基础上，外边套上一个非线性函数使得输出在[0,1]之间。这个函数就是sigmoid 函数，或者叫logistic函数。

h_{θ} (z) = \frac{1}{1 + e x p (- z)} = \frac{1}{1 + e x p (- θ^{T} x)}

$h_\theta (z)=\frac{1}{1+\mathrm{exp}(-z)}=\frac{1}{1+\mathrm{exp}(-\theta ^Tx)}$

那么现在这个 $h_\theta (x)$ 表达的是什么意思呢？表达的是对一个输入x，y等于1的概率是多少。也就是说假如y=0.1，那么说明P(y=1)=0.1，P(y=0)=0.9。这就是逻辑回归。
这里写图片描述

逻辑回归的决策面

如下图所示：
这里写图片描述
假如我们认定如果 $h_\theta (x)>0.5$ 的话，我们就判定 $y=1$ 那么，也就是要求 $z=\theta^Tx>0$ 。
所以对于线性分类面，只要考虑 $z>0$ 和 $z<0$ 的情况即可：

非线性的分类面也是如此：

逻辑回归的cost function

不能使用线性回归的cost function，因为直接使用的话，cost function 会变成非凸函数。而是使用如下的：
这里写图片描述

梯度下降

这里写图片描述

优化进阶

其实出了梯度下降之外，还有很多其他进阶的优化方法，这些方法比梯度下降的方法要快，但是会比较复杂。
这里写图片描述

多分类：one vs all

one vs all（rest）这种方法，其实就是对每一类i，训练一个逻辑回归分类器，然后有新的输入x，那么找到一个i，使得 $h^{i}_\theta(x)$ 最大。
这里写图片描述

正则化

过拟合

过拟合就是因为模型的feature太多，结果导致对训练集上拟合的很好，但是泛化能力很弱。
这里写图片描述

过拟合的处理方法

过拟合有几种处理方法，一种是减少feature数量，然后在模型之间选择，另外就是正则化，正则化就是减少参数 $\theta_j$ 的幅度，这样每一个feature都会给最终的模型贡献一点点。这个对于很多feature的情况下很有用。
这里写图片描述

Intuition

其实就是假如各个参数的大小比较小，那么一些高次的feature贡献的就少，这时候就能够不要那么过拟合。
这里写图片描述

方法就是在cost function后边加上一个 $\lambda \sum_{j=1}^N{\theta_j}$
这里写图片描述

加上正则化之后，过拟合的情况就会得到改善：
这里写图片描述

正好有一个小问题：假如 $\lambda$ 选的很大会出现什么结果？答：underfitting，没法拟合了。
这里写图片描述

如下图所示：
这里写图片描述

线性回归的正则化

如下图所示，其实可以看出来，L2 Regularization等价于weight decay：
这里写图片描述

如果是正规方程的方法：
这里写图片描述

可以看到，假如 $XX^T$ 是奇异的，那么经过正则化之后，变成非奇异的：
这里写图片描述
其实思路很简单，因为 $XX^T$ 的特征值一定是非负的，非零特征值一定大于1个，那么加上这个矩阵之后，所有特征值都是整的了，那么就不是奇异的了。

逻辑回归的正则化

这里写图片描述

同样，加上weight decay。

猜你喜欢

转载自blog.csdn.net/asasasaababab/article/details/81055716

吴恩达机器学习课笔记week 3

吴恩达机器学习笔记3

coursera_机器学习_吴恩达_week3

吴恩达深度学习笔记 course3 week2 机器学习策略(2)

coursera-斯坦福-机器学习-吴恩达-笔记week3

【吴恩达机器学习笔记】week3：1/2逻辑回归

Coursera吴恩达机器学习week3笔记

吴恩达深度学习笔记9-Course3-Week2【机器学习策略（ML Strategy）2】

吴恩达深度学习笔记8-Course3-Week1【机器学习策略（ML Strategy）1】

吴恩达机器学习笔记3-评估假设

吴恩达机器学习课程笔记——Ch3

吴恩达机器学习课程笔记3

吴恩达深度学习2-Week3课后作业-Tensorflow

Coursera吴恩达机器学习week3的ex2编程作业代码

Coursera吴恩达机器学习week4的ex3编程作业代码

coursera_机器学习_吴恩达_week3（补充）

吴恩达网易公开课_机器学习【第3课】笔记：局部加权回归，逻辑回归

吴恩达深度学习笔记3-Course1-Week3【浅层神经网络】

吴恩达深度学习笔记12-Course4-Week3【目标检测】

吴恩达深度学习笔记 course2 week1 作业3

吴恩达深度学习笔记 course3 week1 测验

吴恩达《深度学习与NN》Week 3 课后习题笔记

按部就班的吴恩达机器学习网课用于讨论（3） --未完先休息吧

吴恩达机器学习课笔记week 4

吴恩达机器学习课笔记week 6

吴恩达深度学习1-Week3课后作业-浅层神经网络

吴恩达深度学习2-Week1课后作业3-梯度检测

吴恩达深度学习2-Week2课后作业3-优化算法

吴恩达深度学习4-Week3课后作业-自主驾驶-汽车检测

吴恩达MachineLearning-week3

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

NEFU 117 素数个数的位数

Closest Common Ancestors (Lca,tarjan)

ELK部署

【转载】Hive笔记整理（三）

SQL语句（一）基本表的定义

关于Java web开发中的MySQL的事务语句

MFC创建自定义窗体

如何用一句话激怒程序员？

《逆袭大学》文摘——9.4 基础和应用的平衡中找到大学的节奏

【spring源码分析】@Value注解原理

每日归档

更多

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)