CS229机器学习个人笔记（3）——Logistic Regression+Regularization - 代码天地

CS229机器学习个人笔记（3）——Logistic Regression+Regularization

其他 2019-01-12 02:35:17 阅读次数: 0

版权声明：本文为博主原创文章，未经博主允许不得转载。 https://blog.csdn.net/zpalyq110/article/details/78012858

1.Classification

Logistic Regression其实就是Classification，但是由于历史原因名字被记作了逻辑回归。它与线性回归的区别在于 $h_\theta(x)$ 被限制在了0与1之间，这是通过下面的S函数（Sigmoid function）实现的： $g(z)=\frac{1}{1+e^{-z}}$
其中： $z=\theta^Tx$
此时我们的假设函数 $h_\theta(x)=g(\theta^tx)=\frac{1}{1+e^{-\theta^Tx}}$

2.Cost Function

线性回归中的损失函数是：

J(θ0,θ1…θn)=12m∑i=1m(hθ(x(i))−y(i)))2 $J(\theta_0,\theta_1\dots\theta_n) =\frac{1}{2m}\displaystyle\sum_{i=1}^{m}\left(h_\theta(x^{(i)})-y^{(i)})\right)^2$

其中： $h_\theta(x) = \theta_0+x_1\theta_1+x_2\theta_2+\dots+x_n\theta_n$
线性回归损失函数有很明显的实际意义，就是平方损失。而逻辑回归却不是，它的预测函数 $h_\theta(x)$ 明显是非线性的，如果类比的使用线性回归的损失函数于逻辑回归，那 $J(θ)$ 很有可能就是非凸函数，即存在很多局部最优解，但不一定是全局最优解。我们希望构造一个凸函数，也就是一个碗型函数做为逻辑回归的损失函数。
这里写图片描述

注：虽然得到的梯度下降算法表面上看上去与线性回归的梯度下降算法一样，但是这里的 $h_θ(x)=g(θ^TX)$ 与线性回归中不同，所以实际上是不一样的。另外，在运行梯度下降算法之前，进行特征缩放依旧是非常必要的。

具体求导公式的推导：

3.Multiclass Classification-One-vs-all

这里写图片描述

4.Regularization

线性回归中的Overfitting与Underfitting：
这里写图片描述

逻辑回归中的Overfitting与Underfitting：

这里写图片描述

Overfitting：高偏差
Underfitting：高方差
下图很直观的展现出偏差与方差的区别：
这里写图片描述

怎么来解决过拟合的问题？简单来说造成过拟合是因为次数高的项存在，那么只要减小相应的系数 $\theta$ 就能避免过拟合。

对于线性回归：

这里写图片描述

对于逻辑回归：
这里写图片描述

猜你喜欢

转载自blog.csdn.net/zpalyq110/article/details/78012858

CS229机器学习个人笔记（3）——Logistic Regression+Regularization

斯坦福CS229机器学习笔记-Lecture3 局部加权线性回归和 logistic regression

CS229机器学习个人笔记（2）——Linear Regression with Multiple Variables

CS229机器学习个人笔记（1）——Linear Regression with One Variable

【Andrew NG 机器学习公开课】CS229：Introduction、Linear Regression

【机器学习笔记】Regularization : Ridge Regression（岭回归）

CS229学习笔记（3）

cs229 机器学习

CS229学习笔记

机器学习笔记——logistic回归（logistic regression）

CS229 6.9 Neurons Networks softmax regression

CS229 6.10 Neurons Networks implements of softmax regression

机器学习学习笔记2（Ng课程cs229）

机器学习学习笔记1（Ng课程cs229）

机器学习 cs229学习笔记1

笔记汇总 | 斯坦福 CS229 机器学习

机器学习 cs229学习笔记3 EM alogrithm Mixture of Gaussians revisited

Stanford机器学习---第三讲. 逻辑回归和过拟合问题的解决 logistic Regression & Regularization Stanford机器学习---第三讲. 逻辑回归和过拟合问题的解决 logistic Regression & Regularization

李宏毅机器学习总结笔记2- regression（回归）和regularization（正则化）

数据挖掘day16、17-CS229-WEEK3 Logistic Regression

机器学习笔记3 －－逻辑回归 Logistic Regression

李宏毅机器学习笔记3：Classification、Logistic Regression

机器学习cs229——（一）概要

CS229学习笔记（2）

CS229学习笔记（1）

CS229学习笔记（0）

CS229学习笔记（4）

CS229 Machine Learning学习笔记

机器学习 logistic regression

CS229 5.用正则化(Regularization)来解决过拟合

今日推荐

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

周排行

阿里云短信服务平台注册

Windows下的字符串处理(1)

sqoop: mysql导入数据到hdfs, hive, hbase

commons.lang中常用的工具类

离线安装PostgreSQL11.6

使用PyTorch简单实现卷积神经网络模型

一文彻底搞定谱聚类

一道面试题引发的血案

One Chat for Mac(聊天工具)

TCP/IP的底层队列是如何实现的？

每日归档

更多

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)