sp4.1 Foundations of Convolutional Neural Networks CNN - 代码天地

sp4.1 Foundations of Convolutional Neural Networks CNN

其他 2018-11-15 18:34:33 阅读次数: 0

一般情况下一张分辨率高点的图片就是1000*1000*3维的放在矩阵里3百万啊一列

假设第一层隐藏单元是1000个那么就是1000*3百万的矩阵太大了

w1就是3百万（1000隐藏层，1000*1000*3 输入层）=30亿个参数

所以就要用到卷积了 w*x

1边缘检测：别忘了一般都是低层次到高层次检测的边缘到整体的比如下图照片先检测竖线再水平线

垂直边缘检测：

比如现在给一个灰度图像一层的6*6现在利用一个过滤器或者叫kernel检测竖线进行卷积运算

*就是卷积元素符号对应相乘即可然后蓝色块右移依次计算然后还是从左边下移一格

可视化一下：灰白之间就是垂直边缘加个绝对值也可以

可以可视理解一下第一个例子过滤器是个垂直检测边缘的他和第一个3*3 的相乘出来是0

移动一列再乘是30 也就说明了第一个里面没边缘第二个里有边缘

很多种过滤器：这里过滤器怎样设置也有争论

甚至直接把过滤器当作要求的参数反向传播学习出来

变一变可能识别出70度的直线倾斜的直线

上面卷积的缺点

1会导致图像越来越小

2中间的点会重复多次采集而旁边的点比如四个角的点只被采集了一次

利用Padding:在处理之前在图像外围再加一层或者几层填充有点像前端里的padding

用f*f大小过滤器进行卷积得到就是n-f+1 * n-f+1的阵是越来越小了

现在价格padding就得到n+2p-f+1了

valid卷积就是不填充 Same卷积：让卷积完和之前一样

过滤器f通常奇数3*3 5*5 7*7 因为你想让卷积完和之前一样这样好算吧这样会有个中心像素

stride步长：之前一格一格移动的步长就是1 若整除不是整数就向下取整

实际在数学书或者信号处理中的卷积操作会对过滤器先进行翻转

深度学习中我们的卷积应该成为交叉相关但是在深度学习里就称为卷积了

先关于行对称13行互换然后列互换在逆时针转180读

对于彩色图片：高宽通道6*6*3 就要用三维的过滤器了3*3*3

输出的是二维的啊 4*4 相当于这里3*3*3的数字求和了

这里每层的过滤器里面数字可以不一样

比如想检测红边就可以后面俩都设为0

也可以同时用几个过滤器可能一个同时检测垂直一个检测水平

几组过滤器就是几个面了

卷积神经网络：图像直接当x算过滤器就是w（3*3*3+1）卷积完然后激活函数处理

有个好处就是不管输入图像像素多大参数都是根据过滤器而固定的

这样也不太容易过拟合

用10个过滤器(3*3*3+1b)*10 也就280个参数避免过拟合想想开头以前的方法.

CNN：

最后把7*7*40的展开然后再做个逻辑回归或者softmax就行了

重要的就是这些参数怎么确定 padding 过滤器步长等等

一个典型的CNN一般三层卷积层池化层全连接层

池化层：缩减模型大小提高计算速度同时提高鲁棒性不用学习参数手动设置

提取到每一小块最大特征值平均的不常用

全连接层相当于整合一下所有信息用来把前边提取到的特征综合起来

有时把池化层和卷积层看做一层因为池化层没参数计算只算有权重的层

一般一个或者几个卷积层后再跟个池化层

这一系列卷积池化做完后展开比如现在是400维的，全连接就是再来个以前的单层神经网络

最后的400维的一列再做个WX+B吧 W120*400 * 400*1 变成120*1 可能连好几个

最后再softmax或者逻辑回归什么的

参数还是主要集中在全连接层因为前面都是固定的取决于那个过滤器

激活的数量也是逐渐下降的

机智的one-hot,这里Y是个（1080，1）的直接给reshape-1展开城一行，

np.eye就是生成一个C行的对角矩阵，他这里一展开相当于下标了直接去选取对角阵对应的哪一行

反向传播：卷积操作中的反向传播

这里面最外面的dZ已经给了

池化层的反向传播其实是没有参数的

上一层的导数直接乘上要他们那一块中只保留最大的或者平均

为什么CNN有用

1参数少，传统的参数太多了比如图像是32*32*3的

传统的 32*32*3输入吧隐藏层4704个单元这样子就有 3072*4704=1400W个参数了

假设是1000*1000*3图像就更可怕了

而CNN你用6个过滤器5*5的参数很少 6*（5*5+1b）=156

2参数共享：比如检测竖线的参数可能运用到图片各个位置对于高阶也一样比如检测眼睛的等

3 稀疏连接：比如输出层左上角的值之和原本输入的矩阵前9个数（方块有关）

猜你喜欢

转载自www.cnblogs.com/hellodantong/p/9965243.html

sp4.1 Foundations of Convolutional Neural Networks CNN

Convolutional Neural Networks（week 1）——Foundations of Convolutional Neural Networks

CNN (Convolutional Neural Networks) Abstract

TensorFlow练习4: CNN, Convolutional Neural Networks

Convolutional Neural Networks & CNN Application-2

Convolutional Neural Networks & CNN Application-1

卷积神经网络, Convolutional Neural Networks , CNN

CNN(Convolutional Neural Networks)没有原理只有实现

CS229 6.17 Neurons Networks convolutional neural network（cnn）

卷积神经网络：Convolutional Neural Networks(CNN)

Convolutional Neural Networks

Convolutional Neural Networks:Application

Orthogonal Convolutional Neural Networks

CNN(Convolutional Neural Network)

[神经网络学习笔记]卷积神经网络CNN（Convolutional Neural Networks, CNN）综述

Convolutional Neural Networks(1): Architecture

[学习笔记]convolutional neural networks

Understanding Convolutional Neural Networks for NLP

Convolutional Neural Networks笔记（一）

Convolutional Neural Networks笔记（三）

Convolutional Neural Networks for Sentence Classification

Convolutional Neural Networks笔记（二）

Convolutional Neural Networks:Step by Step

014 Foundation of Convolutional Neural Networks

Convolutional Neural Networks (CNNs / ConvNets)

笔记：Interpretable Convolutional Neural Networks

【Python】Understanding Convolutional Neural Networks for

How Convolutional Neural Networks Work

Interpretable Convolutional Neural Networks研读

Convolutional Neural Networks: One Layer of a Convolutional Network

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

让自己的头脑极度开放

CentOS 6.5(x64) 和Redhat6.5操作系误删libc

高可用注册中心

【日记】12.28/【题解】AtCoder AGC041

XML（5）_XML 约束_DTD

Java集合Map（四）

树梅派安装桌面环境教程

pipenv 的使用和安装

小程序白屏问题和内存研究

C语言简单选择排序

每日归档

更多

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)