入门机器学习(一)

入门初衷

小编本行是红外运动目标识别与跟踪,现有项目用的均是传统方法,解决了哪里有东西,这个东西从哪儿去哪儿的问题,但解决不了他是什么的问题。
老板总喜欢揣摩偶像公司,会让我思索,别人的监控界面具备识别车、船、动物、人等下拉列表,其后用的什么深奥算法?
于是乎,机器学习等概念,慢慢被博客前辈们灌输。


我所理解的机器学习

以下内容均为个人理解,会有很多不完备解释,请谅解。

机器学习领域,喜欢把计算机比作北鼻,在系统还未接受任何知识的时候,他就是刚出身的样子,一张白纸,和天生会有的哭和笑,就像系统自带的声音一样。

他所接受的数据,是0011这种代码,图片这些数据会经过解码一类,转成他能识别的代码。

有一天,你会拿出一张图,告诉计算机,这是一只猫;
过了一天,你又给了一张图,告诉他这是一只狗;
再过了一天,你又给了一张图,告诉他这是一只熊;
就像你告诉婴儿这个是姑姑那个是舅舅一样。

这样每来一张新图,你会告诉他“这是什么”,经过无数个日日夜夜的反复学习……
突然有一天,当你拿出一张熊猫的照片时,你的计算机说:“熊猫”,像极了那个行走在家里的男人,突然被北鼻喊了一句“爸爸”一样。
可是刚才的效率太慢了,对于小孩子来说,那是成长的点滴欢喜;
但对于计算机来说,这样的速度太浪费资源,也不能引领时代进步。

机器学习之监督学习

所以,我们对计算机做一些必要的资料整合,让他在极短的时间里,获得有效的知识。
这个该怎么处理呢?
我们收集成百上千张小猫小狗小熊的照片,并给他们附加标签(即能够代表他们类别的编码),小猫小狗小熊就是,那么多即将被计算机学习的图片,称作样本
所有的图片丢给计算机,他自己去琢磨,如何生成一个函数模型,能够表示他们的特征,以求输出符合对应的标签。
当新的图片来临时,他能不假思索而且无误地回答出来。

模板匹配

最开始在全幅图像寻找目标位置时候,采用模板匹配的方法,怎么讲呢?
如果你想在图像中搜索小狗所在位置,拿一张你觉得比较典型的小狗图像,resize后在待搜索图像上滑动遍历,每个移动过的像素都有一个相似度的相应,最大响应,便是认为的目标所在区域。
可是呢,你的模板上边,除了小狗,还有其他的背景,比如树叶什么,在做相似度评估时候,背景也被当作目标做了相似度评估,是不是影响对目标的辨识呢?
还有,不同场景下的小狗,坐着、站着、躺着的,在单纯做图像相似度计算时候,差距应该也是非常大的。

传统机器学习

我们人类的世界里,光照是最敏感的存在之一,对于形形色色的物体,我们可能会通过轮廓、颜色、纹理结构等辨析物体,计算机不理解呀,他只知道0011这种简单的代号。
以轮廓为例,我怎么让他获得轮廓呢?通过一些梯度函数等卷积得到,比如canny等算子,然后通过一定编码,送给计算机,让他自己去学习,哪种物体,具备哪种轮廓特征。新到的图片,他会首先提取轮廓,然后判断和哪个类的模型最相似。
如果某种物体在某个特征具有显著差别,他能够很好的表述这类特征。
所以传统机器学习中,运用单个特训练样本,比如HOG+SVM等,这里的HOG,就是提取了物体的结构特征。

这里写图片描述

深度学习

刚才提到的单个特征表述物体,我们以偏概全了,毕竟,一个物体作为独立的存在,他不仅仅通过单个特征区分,你比如马和牛长得很像,单纯结构特征并不能完全区分,因此可能还需要其他特征参与评估。
那所以,我们引入这样一个概念:多特征串联。(名字是我自己起的)
怎么讲呢?
同时将多个特征拿进去训练,然后在输出时将所有特征权值化合并处理。毕竟一个特征很难代表这个物体,我就用多个特征嘛。
在深度学习的架构里,输入样本为原始图像,同时做多个卷积核,得到多个隐藏层,这里起始位置的多个卷积核,其实就在提取物体不同的特征。
这里的深度学习时期,很多人喜欢称后机器学习时代。
所以,我理解的,良好的深度学习架构,就是能有效完备的提取物体特征,以使模型最具代表。

这里写图片描述

注意:文中两张图均来自其他公号。
我很喜欢这两张图,他将传统机器学习和深度学习做了很形象的比较:

  • 传统机器学习好似中医把脉,他需要望闻问切后对症下药,中医针对不同的病人,观察他的体质,生成不同的药方,传统机器学习针对不同的检测物体,他会根据经验,提供不同的识别模型;
  • 而后时代的深度学习好似太上老君炼药,我们尽管往炼丹炉里加样本,加标签,系统已经做了很好的硬件处理:该用CPU的用CPU,GPU的调用GPU,你搭个框架,填充数据,开火,坐等效果。
    倘或炼丹炉出来的如果是仙丹,那你的架构就可以用了。

猜你喜欢

转载自blog.csdn.net/weixin_39437164/article/details/82660954