视觉图像AI

一、视觉原理

1、1981年大卫.休伯尔,托斯坦.卫泽尔;对猫做实验(1、简单线条2、复杂运动)

2、福岛邦彦(神经认知模型)光---V1----V2----V3

像素点-----边缘方向-----物体轮廓和细节-----信息整合到一起,进行判断物体

3、杨立昆:卷积神经网络CNN(图像识别)

二、卷积神经网络(数学方法提取出图像的特征)

原图像
0 0 0 0 0 0 0
0 1 0 0 0 1 0
0 0 1 0 1 0 0
0 0 0 1 0 0 0
0 0 1 0 1 0 0
0 1 0 0 0 1 0
0 0 0 0 0 0 0

                                                                  

卷积核
1 0 0
0 1 0
0 0 1
特征图
2 0 1 0 1
0 3 0 1 0
1 0 3 0 1
0 1 0 3 0
1 0 1 0 2

           

 

                    

 

 

   

 

注释:不同的卷积核产生不同的特征,选择卷积核很重要 (上面列子:斜下右上的卷积核对原图像进行卷积,数字越大表示特征越明显333特征明显)

三、池化、激活

特征图

2 0 1 0 1
0 3 0 1 0
1 0 3 0 1
0 1 0 3 0
1 0 1 0 2

       

池化
3 1 1
1 2 1
1 1 2

 选择颜色块区最大的一个值,填写到3x3的表格内,就是池化

激活就用sigmode函数进行激活f(x)=1/1+e^{-x}

0.95 0.73 0.73
0.73 0.95 0.73
0.73 0.73 0.88

 激活到(0-1)范围内的值。

四、算法、数据、算力

算力介绍:算力就是计算的效率(芯片)

1、CPU:通用性比较好,cpu就是中央处理器,特点,并行能力差,串行能力好。

(1、并行:同时计算多个加减法2、串行:只能一个一个计算)

2、GPU:(计算机图像投影到屏幕上)代表公司英伟达,专用性比较强,串行能力差,并行能力好,同时计算多个加减法。

3、NPU:神经网络处理器,专用性和并行能力都比GPU强;华为的升腾910NPU处理器。(目前效率最快的人工智能处理器)

猜你喜欢

转载自blog.csdn.net/chehec2010/article/details/114652957