都是基于梯度下降的逻辑回归与神经网络有什么区别？（逻辑回归参数更新和神经网络反向传播） - 代码天地

都是基于梯度下降的逻辑回归与神经网络有什么区别？（逻辑回归参数更新和神经网络反向传播）

其他 2020-04-03 12:50:53 阅读次数: 0

最近在刷吴恩达的coursea的机器学习视频，学完基于梯度下降的逻辑回归和基于梯度下降的神经网络后，就在反思这两者之间的区别，为什么必须使用神经网络？

逻辑回归不能替代神经网络么？他们的区别是什么呢？

答案：逻辑回归不能替代神经网络。

　　机器学习的本质其实是训练出一组参数，尽可能让基于这组参数的模型能正确识别出所有的样本。

然而，逻辑回归所有参数的更新是基于相同的式子，也就是所有参数的更新是基于相同的规则。相比之下，神经网络每两个神经元之间参数的更新都基于不同式子，也就是每个参数的更新都是用不同的规则。

显而易见，神经网络模型能模拟和挖掘出更多复杂的关系，也具有更好的预测效果。下面详细分析逻辑回归的更新和神经网络的反向传播。

分析：逻辑回归的参数更新。　　假设有m 个样本，他们的cost function(成本函数)为：

其中 h 函数为激活函数， xⁱ为第 i 个样本， theta 为要训练的参数，用向量的形式来写就是：

，其中X为代表所有样本的向量，是二维矩阵，每一行表示一个样本， Y为每一个样本本身应该属于的类。

对上面的cost function的每一个参数theta求偏导，得到逻辑回归的所有参数的更新都根据的规则是：。

通过此式，可以看出影响参数的更新的因素有学习率a，样本个数 m，样本输入X，样本所属于的类。

神经网络的参数更新过程：

本文以上图神经网络为例，输入层有两个神经元，这两个神经元表示一个样本。一个隐藏层，两个输出。

正向传播： i1 ---h1 之间的传播，h1的输入为：。

　　　　　　　　　　　　　　h1 的输出为：假设用激活函数sigmoid，。

　　　　 h1---o1 之间的传播，o1的输入为：。

　　　　　　　　　　　　　　o1 的输出为：

反向传播：

（1）总误差（square error）：

　　

因为有2个输出，所以error由两部分组成

　　　　　　　　　　　　　

　　　　　　　　　　　　　

（2）输出层与隐藏层间的参数更新：

以权重w5为例，

计算：

　　　　　　

计算：

　　　　　　

计算：.

　　　　　　

三者相乘，得到 w5 的更新为：

　　　　　　（

　　　　　　w5的更新值主要与Out _o1 和 Out_h1相关）

　　　　　　同理，w6的更新取决于 Out _o1 和 Out_{h2， W7 的更新取决于 Out _o2 和 Out_{h1， W8 的更新取决于 Out _o2 和 Out_{h2，由此可见每个参数的更新式子都不同}}}

（3）隐藏层与隐藏层间的参数更新：

　　计算W5时，误差是从out_o1 --net_o1--w5 这样传递过来的。

　　而更新 w1 时，路径是 out_h1---net_h1---w1, 而 out_h1先要接收 Eo1 和 E ₀₂传来的误差。

，其中

通过计算可以得到，

所以， W1 的更新取决于Out _o1 ，Out _o2 ， net₀₁, net₀₂, out_h1, net_h1.

即 W1的更新路径是（Out _o1 ----- net_o1 & Out _o2 ----- neto2 ）----- out_h1 ----net_h1 ----W1

W2 的更新路径是（Out _o1 ----- net_o1 & Out _o2 ----- neto2 ）----- out_h1 ----net_h1----W₂

W3 的更新路径是（Out _o1 ----- net_o1 & Out _o2 ----- neto2 ）----- out_h2 ----net_h2----W₃

由此可见，神经网络的反向传播每个参数的路径是不一样的。

　　　

猜你喜欢

转载自www.cnblogs.com/xinyuePhd/p/12625708.html

今日推荐

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

周排行

Metasploit文件目录与入侵基本概念

跨域(CORS)请求问题[No 'Access-Control-Allow-Origin' header is present on the requested resource]常见解决方案

CodeIgniter 源码解读之 CodeIgniter.php（二）

SAS入门之（四）改变数据类型

初识元组

[数学建模]数学建模算法和模型（B站视频）（二）

Nginx 服务器源码安装配置流程

C#实现语音视频录制【基于MCapture + MFile】

开发进度4

下载安装vue的方法网址

每日归档

更多

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)