机器学习笔记——神经网络（neural networks）

其他 2019-01-01 12:35:03 阅读次数: 0

神经网络

非线性假设

对于非线性假设而言，当特征足够多的时候，如果我们仍采用多项式进行线性拟合，那么我们将获得数量非常庞大的高次项，这使得计算变得非常复杂。出于这个原因，我们受到人脑的启发，提出了神经网络

我们可以将logistic单元表示成神经元的形式，中间的神经元代表假设函数h，左侧是输入，右侧是输出

如果我们的输入输出之间经过了多层计算，这样一种结构我们就叫做神经网络

前向传播

为了计算最终的输出，我们可以用前向传播的方法，顾名思义就是由输入一层层向右迭代计算输出

我们把输入特征的层叫做输入层，输出结果的层叫输出层，而中间的层我们统一称为隐藏层

多元分类

对于分类问题，如果输出是多元的，那我们需要构建一个向量来表示输出属于哪一类

反向传播

代价函数

我们已经讲了神经网络的大致结构，那么它的代价函数是什么呢？我们以多元分类问题举例，实际上神经网络的代价函数就是把每一个输出的代价函数求和就得到了最终的代价函数（其中还包括正则化的项）

、

那么有了代价函数，我们怎么求它的最小值呢？我们知道要计算最小值，需要计算代价函数以及代价函数对各个系数的偏导，那么这个计算的过程就叫做反向传播。我们可以由如下过程求出偏导数。我们可以看出我们先定义了输出层的误差δ，也就是最后的输出结果与实际值（1或0）的差值，然后再根据一系列公式（在此就不再推到了）计算出代价函数对每个参数的偏导数

以上是一组数据的情况，那么对于m组训练数据，我们可以采用如下的算法计算偏导数

让我们再来回顾一下上面的过程：首先我们根据一组训练数据从左到右正向计算出输出的值

然后我们再根据输出结果与偏导数计算公式从右到左反向一级级计算出δ，最后计算出偏导数

在得到了代价函数与代价函数对参数的偏导数之后我们就可以利用一些集成的来计算出代价函数的最小值了。需要注意的是我们在表示系数的时候我们一般将系数写成矩阵的形式（每一层有一个系数矩阵），但是在matlab中调用这些高级函数（例如fminunc）需要我们将这些矩阵展开成向量的形式

梯度检测

由于反向传播算法比较复杂，很多时候它很多时候容易出问题。正是这样，我们需要梯度检测来证明我们的结果是否正确。我们会采用导数逼近的形式来观察我们的梯度求得是否正确

以下是高维的情况

由于梯度检测的过程远比神经网络的计算过程计算量大，因此我们一般只进行一次梯度检测，之后将其关闭，再来运行反向传播的代码

还需要注意的是我们在初始化参数的时候不能像logistic回归一样简单地将每个参数置0，因为这会导致对称性权重（symmetry weight）问题，因此我们需要随机化初始参数来进行初始化

总结

下面让我们来对训练神经网络的过程做一个总结。首先我们需要选择一个网络结构，一般来说我们选择一层隐藏层就行

之后我们按以下几个步骤对神经网络进行训练

很多时候代价函数是非凸函数，算法会收敛到局部最小值，但是我们在实操的时候可以知道就算收敛到局部最小值我们仍能取得很好的效果

猜你喜欢

转载自blog.csdn.net/shanwenkang/article/details/85006604

机器学习笔记——神经网络（neural networks）

谷歌机器学习速成课程笔记 15（Training Neural Networks -训练神经网络）

Neural Networks Learning(神经网络学习)

Neural Networks（神经网络）

Neural Networks(神经网络)

[神经网络学习笔记]卷积神经网络CNN（Convolutional Neural Networks, CNN）综述

Stanford机器学习---第五讲. 神经网络的学习 Neural Networks learning Stanford机器学习---第五讲. 神经网络的学习 Neural Networks learning

吴恩达机器学习课程笔记+代码实现(11)8.神经网络的学习(Neural Networks: Learning)

吴恩达机器学习编程作业与笔记（4）第5周：Neural Networks: Learning神经网络：学习

【机器学习网络】神经网络与深度学习-6 深度神经网络（deep neural Networks DNN）

谷歌机器学习速成课程笔记 16（Multi-Class Neural Networks-多类别神经网络）

吴恩达机器学习课程笔记+代码实现(10)神经网络：表述(Neural Networks: Representation)

吴恩达机器学习编程作业与笔记（3）第4周：Neural Networks: Representation神经网络：表示

【机器学习算法】神经网络与深度学习-9 递归神经网络（Recurrent Neural Networks，RNN）

【机器学习算法】神经网络与深度学习-8 1.1.1 CNN卷积神经网络（Convolutional neural Networks ）详解

《Neural Networks and Deep Learning》学习笔记三－神经网络输出层神经元个数

Stanford机器学习---第四讲. 神经网络的表示 Neural Networks representation

Google---机器学习速成课程(十二)- 神经网络简介 (Introduction to Neural Networks)

Stanford机器学习---第四讲神经网络的表示 Neural Networks representation

机器学习之人工神经网络（Artificial Neural Networks，ANN）

MLCC笔记15 - 训练神经网络 (Training Neural Networks)

MLCC笔记14 - 神经网络简介 (Introduction to Neural Networks)

神经网络和深度学习(Neural Networks and Deep Learning)

NLP Neural Networks -nlp神经网络

[Lecture 4] Neural Networks（神经网络）

递进神经网络：Progressive Neural Networks

图神经网络（Graph Neural Networks）

【学习笔记】Neural networks and deep learning-神经网络和深度学习

深度学习笔记（一）——神经网络和深度学习(Neural Networks and Deep Learning)

机器学习笔记 ---- Neural Networks

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

记一下去大梅沙的准备（2018-05-26）

Spring 注解事务

基于HTTP协议的客户端缓存

阿里云rds 备份和还原

[PHP] 几个拖慢 PHP 程序/API 运行速度的点

python 代码风格------------PEP8规则

js控制json生成菜单——自制菜单（一）

将字符串: 'k:1|k1:2|k2:3|k3:4 ' ,处理成 python 字典: {'k':1, 'k1':2, ...}

微信小程序转支付宝小程序

Qt551.窗口滚动条

每日归档

更多

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)