人工智能-卷积神经网络

视觉原理
提出问题

        人和动物如何把看到的图像转化为大脑中的一个概念?
        我们知道计算机是把图转换为一大堆数字,通过训练可以知道这堆数字代表什么含义。但通过前面学过神经网络模型和梯度下降法的方法训练费时费力,而且一旦图片进行改变如缩放、旋转或其他变换,那么计算机就识别不出来了。那么人如何记住的呢?例如一本书,看了一次,后面哪怕是破损了,形状变了也能认出来?

视觉神经实验及神经认知模型

       1981年休伯尔和威泽尔做过实验,给动物看不同图片,观察跟视觉相关的大脑中的细胞变化,主要分为两种

  • 简单视觉神经细胞:对线条敏感,某个方向线条出现变化就会感应
  • 复杂视觉神经细胞:对线条反应,且对线条的运动产生反应

       根据这个实验,提出人是如何检测物体的?日本科学家福岛提出神经认知模型,即人是如何检测物体的是猫还是狗。
       人的大脑中有很多皮层,一层一层对视觉信号进行传输处理。光从眼睛进入后,先计入第一皮层,在进第二皮层,直到最后一个皮层,每个皮层对信号处理的方式是不一样的。

        神经认知模型流程如下;

  • 实际上最开始刚进入视网膜时候是一大堆像素点
    在第一皮层中,从这些像素点抽出一些特征,如边缘,而边缘是具有方向性的,
    在第二皮层中,会将提取的边缘特征进行组合,形成物体的轮廓及物体更多细节
    在第三皮层中,把轮廓和细节组合成一个整体
    最终做出一个判断。

       杨立昆根据这个神经认知模型流程原理(先输入,提取边缘特征,组合组轮廓和细节,在组合轮廓与细节成整体,最后进行判断)发明一种实用的图像识别方法,就是卷积神经网络

猜你喜欢

转载自blog.csdn.net/qq_41946216/article/details/131733058