朋友圈爆款背后的机器视觉--DHZJ

参考：https://blog.csdn.net/guleileo/article/details/80504635

总结如下：

1，计算机视觉研究如何让计算机从图像和视频中获取高级，抽象的信息。从生物角度，计算机视觉可以模仿视觉任务自动化

2，机器视觉：物体识别，对象检测，语义分割，运动和追踪，三维重建，视觉问答，动作识别

3，RGB-alpha格式：8位二进制表示一种颜色，然后alpha表示这个像素点是不是透明的。所以是32位真彩色

4，low level：降噪和优化

mid level：分类，分割，目标检测，情景检测，情景分割，意图检测

5，人脸识别，OCR（optical character recognition）文字识别，车牌识别

6，目标追踪：难点在于，需要追踪的对象由于角度，光照，遮挡的原因，包括运动的时候，他会变得模糊，还有相似背景的干扰，难以找到模板匹配的方法进行追踪

7，多模态问题：（1）根据输入图像，由用户提问，算法自动根据提问内容进行回答

（2）计算机根据输入图像自动生成一段描述图片的文本

8传统图像处理工具：（1）Filter：空间滤波器，傅里叶，小波滤波器

（2）Feature design + classification：SVM、AdaBoost、Bayesian and etc

（3）segmentation & object detection：water-shed ，level-set，active shape and etc

（4）edge detection ，local symmetric ，haar feature【边缘特征，线性特征，中心对称线特征】，SIFT尺度不变特征变换（可应用于有角度，特征位置变化时），HOG方向梯度直方图，Watershed 分水岭算法，ASM（可变模板匹配，提取人脸的主要特征）

9，深度学习，深度神经网络（输入层，隐层，输出层）

10，CNN卷积神经网络，DNN（深度神经网络）

11，手写体识别中有输入，输出，卷积，池化。本例中池化层主要就是降低维度。

12，全连接层：现在大家在慢慢减少全连接层的使用

13，CNN--Fast-RCNN--Faster-RCNN

14，YOLO：用回归的方式解决目标检测问题

15，解析云端AI能力支撑，腾讯云的一些服务：静态加速，负载均衡，云服务器，对象存储，还有一些GPU的计算

16，一般情况下，我们会先用SCD里面的CDM去做一个静态缓存，到离用户最近的节点，这样大家访问H5页面的时候就不会等着图片慢慢加载，因为他会在离你家最近的某一个数据中心里一次性的把它给到手机的客户端上。然后就到负载均衡器，就是把流量负载到背后海量的虚拟机上面。

17，

18，