一、视觉原理
1、1981年大卫.休伯尔,托斯坦.卫泽尔;对猫做实验(1、简单线条2、复杂运动)
2、福岛邦彦(神经认知模型)光---V1----V2----V3
像素点-----边缘方向-----物体轮廓和细节-----信息整合到一起,进行判断物体
3、杨立昆:卷积神经网络CNN(图像识别)
二、卷积神经网络(数学方法提取出图像的特征)
0 | 0 | 0 | 0 | 0 | 0 | 0 |
0 | 1 | 0 | 0 | 0 | 1 | 0 |
0 | 0 | 1 | 0 | 1 | 0 | 0 |
0 | 0 | 0 | 1 | 0 | 0 | 0 |
0 | 0 | 1 | 0 | 1 | 0 | 0 |
0 | 1 | 0 | 0 | 0 | 1 | 0 |
0 | 0 | 0 | 0 | 0 | 0 | 0 |
1 | 0 | 0 |
0 | 1 | 0 |
0 | 0 | 1 |
2 | 0 | 1 | 0 | 1 |
0 | 3 | 0 | 1 | 0 |
1 | 0 | 3 | 0 | 1 |
0 | 1 | 0 | 3 | 0 |
1 | 0 | 1 | 0 | 2 |
注释:不同的卷积核产生不同的特征,选择卷积核很重要 (上面列子:斜下右上的卷积核对原图像进行卷积,数字越大表示特征越明显333特征明显)
三、池化、激活
特征图
2 | 0 | 1 | 0 | 1 |
0 | 3 | 0 | 1 | 0 |
1 | 0 | 3 | 0 | 1 |
0 | 1 | 0 | 3 | 0 |
1 | 0 | 1 | 0 | 2 |
3 | 1 | 1 |
1 | 2 | 1 |
1 | 1 | 2 |
选择颜色块区最大的一个值,填写到3x3的表格内,就是池化
激活就用sigmode函数进行激活
0.95 | 0.73 | 0.73 |
0.73 | 0.95 | 0.73 |
0.73 | 0.73 | 0.88 |
激活到(0-1)范围内的值。
四、算法、数据、算力
算力介绍:算力就是计算的效率(芯片)
1、CPU:通用性比较好,cpu就是中央处理器,特点,并行能力差,串行能力好。
(1、并行:同时计算多个加减法2、串行:只能一个一个计算)
2、GPU:(计算机图像投影到屏幕上)代表公司英伟达,专用性比较强,串行能力差,并行能力好,同时计算多个加减法。
3、NPU:神经网络处理器,专用性和并行能力都比GPU强;华为的升腾910NPU处理器。(目前效率最快的人工智能处理器)