从感知机到卷积神经网络

作者:禅与计算机程序设计艺术

1.简介

20世纪50年代末,基于输入-输出映射的感知机模型逐渐成为机器学习领域中的基础模型。然而,在实际应用中,我们发现该模型存在一些问题。因此,人们对其进行了改进。
随着互联网技术的兴起、计算能力的提升以及数据量的增加,深度学习(deep learning)模型越来越受欢迎。卷积神经网络(Convolutional Neural Network,CNN),特别是通过卷积层来处理图像数据的神经网络模型,已经成为深度学习领域中的热门研究方向之一。
2012年,谷歌的经历带来了一个重要的变化——由多层感知器组成的神经网络结构被卷积层取代,得到了广泛应用。虽然卷积神经网络模型与传统的多层感知器模型相比,在许多方面有很大的优势,但它们还是有很大差距。
在本文中,我将从感知机模型入手,介绍其基本概念及相关术语,并详细阐述感知机模型如何解决回归问题。然后,我会介绍卷积神经网络模型,它主要基于卷积操作而不是全连接操作,能够有效地识别图像数据中的特征。最后,我会给出两个不同任务的样例代码,展示卷积神经网络模型的具体操作。

2. 感知机模型

感知机模型是一个二类分类模型,输入空间X上具有线性可分割特征空间F,每个点x属于标签-1或1,通过一个线性方程y=sign(w^Tx+b)来确定实例x的类别,其中w和b是权重参数和偏置参数。
感知机模型的假设空间为超平面集合H = {w^Tx + b = 0 | w ∈ R^n, b ∈ R},即所有实例都可以用一个超平面划分成两类,而且这些超平面之间没

猜你喜欢

转载自blog.csdn.net/universsky2015/article/details/132158292