入门机器学习（一）

入门初衷

小编本行是红外运动目标识别与跟踪，现有项目用的均是传统方法，解决了哪里有东西，这个东西从哪儿去哪儿的问题，但解决不了他是什么的问题。
老板总喜欢揣摩偶像公司，会让我思索，别人的监控界面具备识别车、船、动物、人等下拉列表，其后用的什么深奥算法？
于是乎，机器学习等概念，慢慢被博客前辈们灌输。

我所理解的机器学习

以下内容均为个人理解，会有很多不完备解释，请谅解。

机器学习领域，喜欢把计算机比作北鼻，在系统还未接受任何知识的时候，他就是刚出身的样子，一张白纸，和天生会有的哭和笑，就像系统自带的声音一样。

他所接受的数据，是0011这种代码，图片这些数据会经过解码一类，转成他能识别的代码。

有一天，你会拿出一张图，告诉计算机，这是一只猫；
过了一天，你又给了一张图，告诉他这是一只狗；
再过了一天，你又给了一张图，告诉他这是一只熊；
就像你告诉婴儿这个是姑姑那个是舅舅一样。

这样每来一张新图，你会告诉他“这是什么”，经过无数个日日夜夜的反复学习……
突然有一天，当你拿出一张熊猫的照片时，你的计算机说：“熊猫”，像极了那个行走在家里的男人，突然被北鼻喊了一句“爸爸”一样。
可是刚才的效率太慢了，对于小孩子来说，那是成长的点滴欢喜；
但对于计算机来说，这样的速度太浪费资源，也不能引领时代进步。

机器学习之监督学习

所以，我们对计算机做一些必要的资料整合，让他在极短的时间里，获得有效的知识。
这个该怎么处理呢？
我们收集成百上千张小猫小狗小熊的照片，并给他们附加标签（即能够代表他们类别的编码），小猫小狗小熊就是类，那么多即将被计算机学习的图片，称作样本。
所有的图片丢给计算机，他自己去琢磨，如何生成一个函数模型，能够表示他们的特征，以求输出符合对应的标签。
当新的图片来临时，他能不假思索而且无误地回答出来。

模板匹配

最开始在全幅图像寻找目标位置时候，采用模板匹配的方法，怎么讲呢？
如果你想在图像中搜索小狗所在位置，拿一张你觉得比较典型的小狗图像，resize后在待搜索图像上滑动遍历，每个移动过的像素都有一个相似度的相应，最大响应，便是认为的目标所在区域。
可是呢，你的模板上边，除了小狗，还有其他的背景，比如树叶什么，在做相似度评估时候，背景也被当作目标做了相似度评估，是不是影响对目标的辨识呢？
还有，不同场景下的小狗，坐着、站着、躺着的，在单纯做图像相似度计算时候，差距应该也是非常大的。

传统机器学习

我们人类的世界里，光照是最敏感的存在之一，对于形形色色的物体，我们可能会通过轮廓、颜色、纹理结构等辨析物体，计算机不理解呀，他只知道0011这种简单的代号。
以轮廓为例，我怎么让他获得轮廓呢？通过一些梯度函数等卷积得到，比如canny等算子，然后通过一定编码，送给计算机，让他自己去学习，哪种物体，具备哪种轮廓特征。新到的图片，他会首先提取轮廓，然后判断和哪个类的模型最相似。
如果某种物体在某个特征具有显著差别，他能够很好的表述这类特征。
所以传统机器学习中，运用单个特训练样本，比如HOG+SVM等，这里的HOG，就是提取了物体的结构特征。

这里写图片描述

深度学习

刚才提到的单个特征表述物体，我们以偏概全了，毕竟，一个物体作为独立的存在，他不仅仅通过单个特征区分，你比如马和牛长得很像，单纯结构特征并不能完全区分，因此可能还需要其他特征参与评估。
那所以，我们引入这样一个概念：多特征串联。（名字是我自己起的）
怎么讲呢？
同时将多个特征拿进去训练，然后在输出时将所有特征权值化合并处理。毕竟一个特征很难代表这个物体，我就用多个特征嘛。
在深度学习的架构里，输入样本为原始图像，同时做多个卷积核，得到多个隐藏层，这里起始位置的多个卷积核，其实就在提取物体不同的特征。
这里的深度学习时期，很多人喜欢称后机器学习时代。
所以，我理解的，良好的深度学习架构，就是能有效完备的提取物体特征，以使模型最具代表。

这里写图片描述

注意：文中两张图均来自其他公号。
我很喜欢这两张图，他将传统机器学习和深度学习做了很形象的比较：

传统机器学习好似中医把脉，他需要望闻问切后对症下药，中医针对不同的病人，观察他的体质，生成不同的药方，传统机器学习针对不同的检测物体，他会根据经验，提供不同的识别模型；
而后时代的深度学习好似太上老君炼药，我们尽管往炼丹炉里加样本，加标签，系统已经做了很好的硬件处理：该用CPU的用CPU，GPU的调用GPU，你搭个框架，填充数据，开火，坐等效果。
倘或炼丹炉出来的如果是仙丹，那你的架构就可以用了。