斯坦福大学CS231课程学习笔记（1——3章） - 代码天地

斯坦福大学CS231课程学习笔记（1——3章）

业界资讯 2018-09-12 17:28:50 阅读次数: 0

第一章：计算机视觉梗概

第二章：图像分类途径

assignment1

python+Numpy简单教程：
http://cs231n.github.io/python-numpy-tutorial/

Image Classification: A core task in Computer Vision（核心任务）
————计算机可以识别图像里面的内容。

The Problem: Semantic Gap（计算机眼里的图片是一系列像素的数值，如何解决语义隔阂？）
Challenges: Viewpoint variation（视觉变化，计算机看到的图像又是不同的，十分复杂）
Challenges: Illumination（光线？）
Challenges: Deformation（视觉中物体的姿态？）
Challenges: Occlusion（产生遮挡？）
Challenges: Background Clutter（视觉中的物体和背景非常相似时又该如何识别？？？）
Challenges: Intraclass variation（物种问题？？物体多物种）

An image classifier（分类器）：是一个函数，参数是一张image输出是图片的label
下面是关于分类器的一些尝试：
1.寻找图片里面元素的边界，因为一个边界往往是像素值相同，所以可以描绘出边界勾勒出物体的轮廓，寻找一些角。
2.数据驱动的方式
收集一些有标签图片作为数据集——>用这个数据集来训练分类器（机器学习的办法）——>评估这个分类器（新的图像）train和predict两个函数

First classifier: Nearest Neighbor（最近邻）
train函数：输入参数:image+label 机器学习方法返回model
predict函数：输入model还有新的测试image 返回label

一个核心思想应该就是会有大量的训练数据集，训练完毕来测试新数据的时候，会和之前的训练数据集进行比较，然后label就是最近邻居的label。
那么问题来了，如何比较图像呢？也就是：

Distance Metric（距离度量） to compare images：
用的是：L1距离——曼哈顿距离
这里写图片描述

缺点：训练很快，预测很慢，不符合我们的要求。
一张图表示缺点：只有一个最近邻决定的缺点

边界不平滑，起伏很大，会导致效果不好。

所以采用K-Nearest Neighbors
不单单和一个最近邻来进行比较，而是K个最近邻投票决定

K-Nearest Neighbors: Distance Metric

这里写图片描述
没办法说L1L2哪一个比较好看实际来决定。这种参数叫做超参数（K L1 L2）

关于超参数的选择：
这里写图片描述

k-Nearest Neighbor on images never used.

Very slow at test time
Distance metrics on pixels are not informative（提供信息）
Curse of dimensionality（维度灾难）

线性分类器：
这里写图片描述

线性分类器的分类原理——有点类似于线性函数对于区域的划分

一些不适用线性分类器的情况——很难划分
这里写图片描述

第三章：损失函数和优化

一.损失函数：当前分类器的好坏
如现在有一个数据集：
这里写图片描述

有N项，X是图像，Y是label
损失函数是：
这里写图片描述
Multiclass SVM loss：：是一个Hinge loss（合页损失函数）

这里写图片描述
不会唯一的，因为是一个倍数的问题。

数据损失项+回归项：
这里写图片描述
超级参数：归一化强度

这里写图片描述

Softmax Classifier Multinomial Logistic Regression
分数转化为一个概率性的东西。
这里写图片描述

二.优化
一个人走下山的一个正确的路径：

Strategy #1: A first very bad idea solution: Random search
Strategy #2: Follow the slope
一维是微分，多维是梯度（偏微分）。
Gradient Descent：梯度下降

Stochastic Gradient Descent (SGD)

猜你喜欢

转载自blog.csdn.net/eiobiea/article/details/82562047

斯坦福大学CS231课程学习笔记（1——3章）

【CS231n】cs231斯坦福大学计算机视觉课程笔记翻译--学习（转载）

斯坦福大学深度学习视频（CS231n课程）

【CS231n】斯坦福大学李飞飞视觉识别课程笔记（一）：Python Numpy教程(1)

【CS231n】斯坦福大学李飞飞视觉识别课程笔记（三）：Python Numpy教程(3)

吴恩达斯坦福大学机器学习 CS229 课程学习笔记（二）

吴恩达斯坦福大学机器学习 CS229 课程学习笔记（一）

【CS231n】斯坦福大学李飞飞视觉识别课程笔记（四）：图像分类笔记（上）

【CS231n】斯坦福大学李飞飞视觉识别课程笔记（六）：线性分类笔记（上）

【CS231n】斯坦福大学李飞飞视觉识别课程笔记（五）：图像分类笔记（下）

【CS231n】斯坦福大学李飞飞视觉识别课程笔记（十）：最优化笔记（下）

【CS231n】斯坦福大学李飞飞视觉识别课程笔记（八）：线性分类笔记（下）

【CS231n】斯坦福大学李飞飞视觉识别课程笔记（七）：线性分类笔记（中）

【CS231n】斯坦福大学李飞飞视觉识别课程笔记（九）：最优化笔记（上）

【CS231n】斯坦福大学李飞飞视觉识别课程笔记（二）：Python Numpy教程(2)

Coursera上的斯坦福大学的机器学习课程

斯坦福大学Tensorflow与深度学习实战课程

斯坦福大学Andrew Ng教授《机器学习》课程的个人学习笔记

斯坦福大学公开课：机器学习课程(Andrew Ng)[1]

斯坦福大学机器学习课程第一周笔记

编程范式(斯坦福大学)学习笔记《三》

编程范式(斯坦福大学)学习笔记《七》

编程范式(斯坦福大学)学习笔记《二》

编程范式(斯坦福大学)学习笔记《九》

编程范式(斯坦福大学)学习笔记《五》

编程范式(斯坦福大学)学习笔记《四》

编程范式(斯坦福大学)学习笔记《八》

编程范式(斯坦福大学)学习笔记《一》

编程范式(斯坦福大学)学习笔记

[斯坦福大学2014机器学习教程笔记]第一章-引言（1）

今日推荐

富文本编辑器 Quill 2.0 重磅发布，特性、可靠性与开发者体验大幅提升

“开源信徒”周鸿祎开源360智脑大模型

周排行

Ubuntu 14.04 下Fuel6.0安装部署

香港一小巴侧翻致1死16伤警方：未见机件故障

pikachu--XSS盲打

阅读深入理解JVM虚拟机笔记一

java.sql.SQLException: ORA-00932: 数据类型不一致: 应为 -, 但却获得 CLOB

oracle delete all object under an user

[LeetCode]20 Valid Parentheses 有效的括号

树形DP求树的直径【模板】

Context propagation over HTTP in Go

【PAT】（B）1053 住房空置率 (20)*

每日归档

更多

2024-04-18(0)

2024-04-17(5)

2024-04-16(70)

2024-04-15(42)

2024-04-14(0)

2024-04-13(119)

2024-04-12(38)

2024-04-11(14)

2024-04-10(68)

2024-04-09(5)