【深度学习】cs231n 计算机视觉（4） - 代码天地

【深度学习】cs231n 计算机视觉（4）

其他 2020-06-18 23:49:06 阅读次数: 0

计算机视觉（斯坦福2017课程）

循环神经网络（RNN：recurrent neural networks）

在这里插入图片描述

在这里插入图片描述

语言建模问题经常被运用到RNN领域
完全监督来训练这个模型；
多层循环神经网络：

LSTM（长短期记忆网络：Long Short Term Memory）

在这里插入图片描述
LSTM被设计用来解决RNN中可能会出现的梯度消失和梯度爆炸问题，以更好的结构来获取更好的梯度流动。
i代表input gate（输入门）；
f代表forget gate（遗忘门）；
g代表gate gate；
o代表output gate（输出门）；

分割、定位和检测（计算机视觉中的其他任务）

语义分割：

用类别来做切分，整体的网络结构图如下：

upsampling的过程：
采用下图两种方式：
或者采用转置卷积的方式：

图像分类和定位：
和目标检测的区别在于，对于图像分类和定位，你会率先知道这张图片中有一个或不止一个物体（具体数目了解）是你需要寻找的。
目标检测（object detection）：
候选区域法：

R-CNN系列：

yolo和SSD：
物体分割问题（instance segmentation）：
Mask R-CNN：

生成式模型（无监督学习的一种）

无监督学习：
k-means clustering是一个比较出名的例子；
生成式模型：

生成式模型可以解决密度型问题；
针对于显式密度模型和隐式密度模型可以区分为一些分支：
Pixel RNN/CNN：
对一个密度分布进行显式建模（显式的计算p(x)）；个人理解就是对训练数据进行最大似然计算（总结出来各个像素点的概率），由此为结果来训练RNN/CNN，从而得到一个模型可以用来从图片顶点链式生成整个图片各个点的像素的模型；
CNN相对于RNN在训练时比较快，但是对于生成图片时较慢，因为从顶点像素链式生成出所有像素的图片；
Variational Autoencoder(VAE)变分自动编码器:

自动编码器的无监督学习：

z在维度上比x小，因为z应该用来表示x当中最重要的特征；

最终的整体结构如下，训练好后会删去decoder部分：
GANs：

在GANs中我们不再在显式的密度函数上下功夫，而是采用一个博弈论的方法，并且模型将会学会从训练分布中生成数据；
目的是从一个复杂的高维训练分布中采样，如果想从这样的分布中生成样本，是没有什么直接的生成方法可以采用的，换句话说，该分布十分复杂，我们无法从中直接采样，因此将要采用的方案是，从一个简单点的分布中采样，这样一来我们要做的就是习得一个从这些简单分布直接到我们想要的训练分布的一个变换。
包含判别器网络和生成器网络两部分，二者像在做博弈一样，生成器网络生成的一些图像，交给判别器网络来判别哪些是生成器网络生成的真的好的图像，哪些是生成的不好的赝品图像。

如果生成器网络能够生成一些图像，能够欺骗的过判别器网络，那么就代表我们获得了一个很好地生成器模型；

在这里插入图片描述

如何训练一个GANs网络：

强化学习

在这里插入图片描述

强化学习的过程一般采用马尔科夫决策过程：
马尔科夫决策过程（Markov decision process）：

猜你喜欢

转载自blog.csdn.net/qq_43348528/article/details/104657792

【深度学习】cs231n 计算机视觉（4）

CS231n《深度学习与计算机视觉》 -- 第二讲图像分类

斯坦福CS231N深度学习与计算机视觉

【深度学习】cs231n 计算机视觉（2）

【深度学习】cs231n计算机视觉 SVM分类器

【深度学习】cs231n计算机视觉 KNN分类器

【深度学习】cs231n计算机视觉 Softmax分类器

【深度学习】cs231n计算机视觉 - assignment2 : tensorflow入门

【深度学习】cs231n计算机视觉 CNN（卷积神经网络）

【深度学习】cs231n 计算机视觉（3）

斯坦福CS231n深度学习与计算机视觉课程学习笔记（3）——Loss Functions and Optimization

斯坦福CS231n深度学习与计算机视觉课程学习笔记（2）——Image Classification

斯坦福CS231n深度学习与计算机视觉课程学习笔记（1）——Introduction

CS231n《深度学习与计算机视觉》-- 作业下载及CIFAR-10数据集下载

【deep learning】斯坦福CS231n—深度学习与计算机视觉(资料汇总)

【深度学习】cs231n计算机视觉 Neural Network（两层神经网络）（1）

【深度学习】cs231n计算机视觉 Neural Network（两层神经网络）（2）

计算机视觉 CS231n Course Introduction

Stanford curriculum cs231n学习记录(2)计算机视觉任务

cs231n学习笔记（一）计算机视觉及其发展史

cs231n 学习笔记（1）- 计算机视觉和图像分类

cs231n 计算机视觉（学习笔记1-3）

Stanford CS231n深度学习与视觉－1学习笔记

[深度学习与计算机视觉] 斯坦福 CS231n 2017 学习笔记 -1 (Lecture 1: Introduction;课程介绍)

深度学习CS231N学习笔记（从1到4）

CS231n 斯坦福深度视觉识别课学习笔记

全球名校课程作业分享系列(8)--斯坦福计算机视觉与深度学习CS231n之tensorflow实践

全球名校课程作业分享系列(6)--斯坦福计算机视觉与深度学习CS231n之神经网络细解与优化尝试

全球名校课程作业分享系列(5)--斯坦福计算机视觉与深度学习CS231n之特征抽取与图像分类提升

全球名校课程作业分享系列(3)--斯坦福计算机视觉与深度学习CS231n之softmax图像多分类

今日推荐

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

周排行

计算机组成与设计（七）—— 除法器

Integer Approximation(分治+枚举)

大话数据库索引

windows10系统JDK的配置及下载地址

mysql实现秒值转换中原六仔平台搭建

Codeforces Round #556 (Div. 1)

百练1064 网线主管

Codeforces 995F Cowmpany Cowmpensation

子集生成之增量构造法，位向量法，二进制法

ERROR: cmd.exe failed with args /c "/APK\gradle\rungradle.bat...

每日归档

更多

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)