线性分类器: Linear Classifier

线性分类器:通过线性映射,将数据分到对应的类别中

①线性函数:fxi, W, b= W * xi + b

W为权值(weights),b为偏移值(bias vector),xi为数据

假设每个图像数据被拉长为一个长度为D的列向量,其大小为[D x 1];W是大小为[K x D]的矩阵,b是大小为大小[K x 1]的列向量

以CIFAR-10为例,xi包含第i个图像的所有像素信息,这些信息被拉成为一个[3072 x 1]的列向量,W的大小为[10 x 3072],b的大小为[10 x 1]

因此,3072个数字(原始像素数值)作为输入,10个数字(不同分类得到的分值)作为输出,然后概率最大的分类作为输出

②对W和b的理解:

W:W是一个m行n列的矩阵,[m x n]。其中矩阵的每一行,对应着不同的分类器/分类模板,一共有m个分类模板。W与数据X矩阵乘,是为了计算每一个分类输入的数据(图像)的匹配度,因此假设Xi是一个[n x 1]的列向量,则W*Xi ->  [m x n] * [n x 1] 得到的是[m,1],即m行一列,其中每一行的数字代表着输入的图像与该分类模版的匹配程度,每一个匹配度加上对应的偏移值,最后只需从m个数字中选出匹配度最大的那个数所对应的分类即可,该分类就是输入图像所属分类

b:b是一个m行1列的矩阵,[m x 1]。矩阵的每一行对应着不同分类的偏移值,一共有m种分类,所以一共有m行

关于训练与参数W、b的关系:通过训练不断学习,更新W和b,训练的目标就是获取参数W和b,因此训练过程中参数W和b是在不断调整的,调整的目的是使得模型计算出来的分类情况与训练集中图像数据的真实标签相符

附:矩阵相乘的定义

猜你喜欢

转载自www.cnblogs.com/shiliuxinya/p/12219593.html