【神经网络】{4} ——多元分类（学习笔记）

如何利用神经网络解决多类别分类问题？

（手写数字的识别问题，其实就是一个多类别分类问题，因为它有10种需要识别的类别，也就是数字0到9。）

要在神经网络中实现多类别分类，采用的方法本质上是一对多法的拓展。

假设有一个计算机视觉的例子，我们不只需要识别出图中的汽车，现在我们需要识别四个类别的对象，通过图像来辨别出哪些是行人、汽车、摩托车或者货车：
在这里插入图片描述

这样的话，我们要做的就是建立一个有四个输出单元的神经网络：
在这里插入图片描述
现在神经网络的输出将是一个含4个数的向量：

输出变成了一个四维的向量，那么现在要做的就是，用第一个输出单元来判断图中是否是一个行人，再用第二个输出单元来判断图片中是否是一辆汽车，以此类推……

当图像中是一个行人时，理想情况下，这个网络会输出：
在这里插入图片描述
当图中是一辆汽车时，希望输出：

以此类推……

现在可以说我们有4个逻辑回归分类器：
在这里插入图片描述
它们每一个都将识别图片中的物体是否是四种类别中的一种。

这就是四输出单元的神经网络：
在这里插入图片描述

下面是h(x)对应不同图片的取值情况，我们对这种设定下的训练集的表示方式如下所示：
在这里插入图片描述

当训练集中有各种图片，包含行人、汽车、摩托车、卡车，应该怎么办呢？

首先，输出的表示方法如下所示：
在这里插入图片描述
y ^(i)的值取决于对应的图像x ^(i)，那么一个训练样本将由一组(x ^(i), y ^(i))组成。

其中x ^(i)就是四种物体其中一种的图像，而y ^(i)就是这些向量中的一个：
在这里插入图片描述

我们希望找到一个方法，让神经网络输出一些数值，输出值h(x^ (i))约等于y^ (i)，并且h(x^ (i))和y^(i)在该例子中都是四维向量，分别代表四种不同的类别。

这需要一个算法，它能在给定训练集时，为神经网络拟合参数。下一篇笔记会提到。

这就是让神经网络解决多类别分类问题的方法。

参考资料：吴恩达机器学习系列课程

Giyn

发布了9 篇原创文章 · 获赞 15 · 访问量 554

私信关注