Deep Learning: Chapter 6 深度前馈网络（前言） - 代码天地

Deep Learning: Chapter 6 深度前馈网络（前言）

其他 2018-05-08 23:00:00 阅读次数: 3

给定足够大的模型和足够大的标注训练数据集，我们可以通过深度学习将输入向量映射到输出向量，完成大多数对人来说能迅速处理的任务。其他任务，比如不能被描述为将一个向量与另一个响亮相关联的任务，或者对于一个人来说足够困难并需要时间思考和反复琢磨才能完成的任务，现在仍然超出了深度学习的能力范围。

深度前馈网络（前馈神经网络/多层感知机），是典型的深度学习模型。这种模型被称为前向(forward)的，是因为信息流过x的函数，流经用于定义f的中间计算过程，最终到达输出y。在模型的输出和模型本身之间没有反馈连接。当前馈神经网络被扩展成包含反馈连接时，它们被称为循环神经网络。

训练样本直接指明了输出层在每一点x上必须做什么；它必须产生一个接近y的值。但是训练数据并没有直接指明其它层应该怎么做。

一种理解前馈网络的方式是从线性模型开始，并考虑如何克服它的局限性。为了扩展线性模型来表示x的非线性函数，我们可以不把线性模型用于x本身，而是用于在一个变换后的输出h(x)上，这里h是一个非线性变换。同样，我们可以使用核技巧，来得到一个基于隐含地使用h映射的非线性学习算法，我们可以认为h提供了一组描述x的特征，或者认为它提供了x的一个新的表示。

接下来的问题就是如何选择映射h。（1）其中一种选择是使用一个通用的h，其中的问题是如果h(x)具有足够高的维数，我们总有能力来拟合训练集，但是对于测试集的泛化往往不佳；（2）另一种选择是手动设计h，这种方法对于每个单独的任务都需要人们长时间的努力，并且不同领域之间很难迁移；（3）深度学习的策略是去学习h。

首先，训练一个前馈网络至少需要做和线性模型同样多的涉及决策：选择一个优化模型、代价函数以及输出单元的形式。前馈网络已经引入了隐藏层的概念，这需要我们去选择用于计算隐藏层值的激活函数。我们还必须设计网络的结构，包括网络应该包含多少层、这些层应该如何连接，以及每一层包含多少个单元。

猜你喜欢

转载自blog.csdn.net/weixin_40516558/article/details/80151215

Deep Learning: Chapter 6 深度前馈网络（前言）

Deep Learning: Chapter 6 深度前馈网络 6.2 基于梯度的学习

deep learning:深度前馈网络

Deep Learning 学习笔记2：深度前馈网络（一）

Bengio Deep Learning 初探 —— 第6章：前馈神经网络

[Deep Learning] 前馈神经网络FNN

机器学习(Machine Learning)&深度学习(Deep Learning)资料(Chapter 1)

机器学习----(Machine Learning)&深度学习(Deep Learning)资料(Chapter 1)

机器学习 Machine Learning 深度学习 Deep Learning 资料 Chapter 1

机器学习 Machine Learning 深度学习 Deep Learning 资料 Chapter 2

NeuralNetwork And Deep Learning 实验操作Chapter 1

「Deep Learning」Note on Machine Learning Yearning Chapter 1

Deep Learning阅读笔记：Chapter 5—Machine Learning Basics(2)

Deep Learning阅读笔记：Chapter 5—Machine Learning Basics(1)

6、Brief Introduction of Deep Learning（深度学习简介）

Neural network and deep learning阅读笔记（6）深度学习

【深度学习】Deep Learning

Deep Learning - 第六章：前馈神经网络

【Deep Learning笔记】前馈神经网络和BP算法

deep learning 花书第一章：激活函数前馈神经网络

Deep Learning（Ian Goodfellow） — Chapter2 Linear Algebra

Deep Learning（Ian Goodfellow） — Chapter1 Introduction

Deep Learning阅读笔记：Chapter 2—Linear Algebra

Deep Learning阅读笔记：Chapter 4—Numerical Computation

Deep Learning阅读笔记：Chapter 3—Probability and Information Theory

NeuralNetwork And Deep Learning 实验操作Chapter3

Deep Learning Chapter02：Python基础语法回顾

Chapter 6 Temporal-Difference Learning

ML Lecture 6: Brief Introduction of Deep Learning

6. A Deeper Understanding of Deep Learning

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

记一下去大梅沙的准备（2018-05-26）

Spring 注解事务

基于HTTP协议的客户端缓存

阿里云rds 备份和还原

[PHP] 几个拖慢 PHP 程序/API 运行速度的点

python 代码风格------------PEP8规则

js控制json生成菜单——自制菜单（一）

将字符串: 'k:1|k1:2|k2:3|k3:4 ' ,处理成 python 字典: {'k':1, 'k1':2, ...}

微信小程序转支付宝小程序

Qt551.窗口滚动条

每日归档

更多

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)