计算机视觉与深度学习-图像分类人物介绍&线性分类器（上）

企业开发 2023-04-09 18:32:40 阅读次数: 0

1 图像分类

1.1 图像分类的定义

从已知的标签集合中为给定的输入图片选定一个类别标签

1.2 对图像处理的影响因素

视角、光照、尺度、遮挡、截断、类内形变、运动模糊、类别繁多

1.3 基于规则的分类方法

通过硬编码的方法识别物体或者其他类（困难）
已经做的尝试：图像–>边缘检测–>提取角点

1.4 数据驱动的图像分类方法

1）数据集构建
2）分类器设计与学习
在这里插入图片描述
①图像表示：

像素表示
全局特征表示（如GIST)
局部特征表示（如SIFT特征+词袋模型）

②分类模型：

近邻分类器
贝叶斯分类器
线性分类器
- 线性映射，将输入的图像特征映射为类别分数，输入图像与评估模板的匹配程度越高，分类器输出的分数就越高
- 定义、决策、矩阵表示、权值向量、决策边界
支撑向量机分类器
神经网络分类器
随机森林
Adaboost

③优化方法：

一阶方法
- 梯度下降
- 随机梯度下降
- 小批量随机梯度下降
二阶方法
- 牛顿法
- BFGS
- L-BFGS

④训练过程：

数据集划分
数据预处理
数据增强
欠拟合与过拟合
- 减小算法复杂度
- 使用权重正则项
- 使用droput正则化
超参数调整
模型集成

⑥损失函数

是个函数，用于度量预测值与真实值的不一致成都，输出通常是绝对值
输出值作为反馈信号调整分类器参数，以此降低损失值，提升分类器的分类效果
损失函数的一般定义 L = $\frac{1}{N}$ $\sum\limits_{i}$ L $_{i}$ (f(x $_{i}$ ,W),y $_{i}$ )
多类支撑向量机损失
S $_{ij}$ =f $_{j}$ (x $_{i}$ ,w $_{j}$ ,b $_{j}$ )=w $_{j}^{T}$ x ${i}$ +b $_{j}$
- j：类别标签，取值范围{1，2，…，c}；
- w $_{j}$ ,b $_{j}$ ：第j哥类别分类器的参数；
- x $_{i}$ ：表示数据集中的第i个样本
- s $_{ij}$ ：第i个样本第j类别的预测分数
- s $_{yi}$ ：第i个样本真是类别的预测分数
- 第i个样本的多类支撑向量机损失定义如下：
  L $_{i}$ = $\sum\limits_{j≠yi}$ max(0,s $_{ij}-s_{yi}$ +1)

3）分类器决策
在这里插入图片描述

1.5 图像类型

1）二进制图像（[0、1]）
2）灰度图（[0:255]*1）
3）彩色图像（[0:255]*3）

猜你喜欢

转载自blog.csdn.net/weixin_44606139/article/details/126723078

计算机视觉与深度学习-图像分类人物介绍&线性分类器（上）

计算机视觉与深度学习-线性分类器（下）

深度学习与计算机视觉（一）图像分类与KNN

【学习笔记】计算机视觉与深度学习(1.线性分类器)

深度学习与计算机视觉（二）线性SVM与Softmax分类器

深度学习与计算机视觉系列(3)_线性SVM与SoftMax分类器--在深度学习的视觉分类中的，这两个分类器的原理和比较

计算机视觉学习笔记（第一期）:一.图像分类：2.线性分类器

斯坦福cs231n计算机视觉——KNN，线性分类器(上)

CS231n《深度学习与计算机视觉》 -- 第二讲图像分类

计算机视觉——飞桨深度学习实战-图像分类算法原理与实战

计算机视觉（六）图像分类

计算机视觉（5）—— 图像分类

【计算机视觉】图像分类

【计算机视觉 | 图像分类】图像分类常用数据集及其介绍（三）

【计算机视觉 | 图像分类】图像分类常用数据集及其介绍（一）

【计算机视觉 | 图像分类】图像分类常用数据集及其介绍（十三）

【计算机视觉 | 图像分类】图像分类常用数据集及其介绍（十四）

【计算机视觉 | 图像分类】图像分类常用数据集及其介绍（二）

【计算机视觉 | 图像分类】图像分类常用数据集及其介绍（十二）

【深度学习】cs231n计算机视觉 KNN分类器

【深度学习】cs231n计算机视觉 Softmax分类器

【深度学习】cs231n计算机视觉 SVM分类器

深度学习应用篇-计算机视觉-图像分类[3]：ResNeXt、Res2Net、Swin Transformer、Vision Transformer等模型结构、实现、模型特点详细介绍

计算机视觉(CV)任务介绍：分类、检测、分割、超分、关键点识别、图像生成、度量学习

【计算机视觉 | 图像分类】arxiv 计算机视觉关于图像分类的学术速递（12 月 5 日论文合集）（上）

计算机视觉教程核心版(二)线性分类

【计算机视觉 | Pytorch】timm 包的具体介绍和图像分类案例（含源代码）

计算机视觉-图像描述符（图片分类）

计算机视觉入门--图像分类简介及算法

计算机视觉教程核心版(一)图像分类

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

让自己的头脑极度开放

CentOS 6.5(x64) 和Redhat6.5操作系误删libc

高可用注册中心

【日记】12.28/【题解】AtCoder AGC041

XML（5）_XML 约束_DTD

Java集合Map（四）

树梅派安装桌面环境教程

pipenv 的使用和安装

小程序白屏问题和内存研究

C语言简单选择排序

每日归档

更多

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)