机器学习入门之了解机器学习

机器学习入门之了解机器学习

为什么要学机器学习?

机器学习近几年很火,虽然有一定的炒作嫌疑,但是世界上一些国家,一些大型公司陆续成立机器学习研究室,研究团队。阿里巴巴的人工智能研究室,谷歌的Alpha Go团队等等。举个例子,2012年美国大选期间,奥巴马就拥有一个机器学习的团队,他们收集各种数据,然后对数据进行分析,为奥巴马提示下一步行动。比如,他们利用机器学习分析社交网络数据,判断出总统候选人在第一次辩论后哪些人会倒戈,并根据所分析结果采取不同的宣传策略。又或是分析出哪些区域的人很愿意花钱与名人聚餐,利用分析的结果奥巴马团队举办了几次聚餐,为竞选筹备了10忆美元。当然还分析出了在哪些时间段投放广告最有用,不管如何这个团队帮助奥巴马获得了大选胜利,同时也被奥巴马称为“竞选核武器”。除了帮助奥巴马竞选,我们还可以利用机器学习做很多有意义的是,比如前阵子我做的手写数字识别,或者百度拼了老本在大力宣传的无人驾驶,以及语音识别等等很多领域。可以说机器学习才开始起步,很多领域处于发展阶段。还有个新闻,找不到了,大概就是说阿里巴巴的一个机器学习工程师帮助一家工厂节省了一年几亿元的成本。

在可见的未来,机器学习一定能够帮助人类更上一个台阶。简单来说,一切有一定基本规则的工作都可能被机器学习所替代,比如流水线上的工人,汽车司机等等。结果就是解放了许多人力,当然不好的结果就是有很多人要失业了。掌握技术的企业,人才会赚的盆满钵满,而懒惰没有一技之长(特别是那些可以被机器学习替代的职业)的人会面临事业的风险。马太效应更加明显了。如果你还年轻,工作又是一些重复性性规则性的工作时,那么赶快换行业吧,学学艺术,经商,或者学机器学习也是不错的。当然这些只是我的一些愚见,看看就好。

什么是机器学习?

机器学习就是将获取的数据进行分析,找出内在的规律,然后利用这个学习到的规律对新数据进行预测,得到一些我们想要的结果。比如,手写数字识别。首先,我们必须收集到0-9的手写数字集,利用一些手段找出每个数字的特征,然后这些特征丢给建立的学习器进行学习,生成模型。当我们遇到一个新的手写数字时,只要处理出这个新数据的特征,然后丢给这个模型进行判断,就可以得出这个新数据是哪个数字了。类似的应用还有图像识别(包括人脸识别),数值分析等。

下面图可以大致概括机器学习

这里写图片描述

机器学习就好比我们的课堂,课本知识-学习-考试。书本知识就是数据,老师教学方法以及每个学生的学习方法学习效率组合起来就是就是学习器,书本的知识经过老师的讲解以及学生的理解在学生的大脑形成知识体系,也就是模型。我们学习机器学习就是学习不同的学习器在不同的情况下该如何运用哪种学习器,好比英语,与物理,两种的学习方法可以说差别很大的。使用恰当的学习器,就好比遇到良师,使用了正确的学习方法,学习效果就很好了,遇到新数据就能更好的判断,也就是在考试中遇到新题目能够写出更准确的答案。说白了就是选择好的学习器(优秀教师,高效的学习方法),对数据(课本知识)进行分析学习得到一个良好的模型(知识体系),我们就能够利用这个模型来进行有效的判断(考试中获取更高分的成绩)。

这里写图片描述
上图的点就是数据,两条线就是不同学习器经过学习得到的不同结果。以红线为例,当来一个新数据(5,6.9),这时我们可以确定这个新数据在红线右侧,属于红点,故把新数据划归红点。很难说模型哪种更好,对不不同的场景蓝线可能更符合,反之亦然。比如一个新数据处于红线以及蓝线相夹的区域,不同的分类就会有不同结果。我们只能通过实际来选择学习器。

好了,这算是对机器学习一个简单的理解吧。深入就要涉及一些算法,公式了。以后有机会可以写写。

发布了67 篇原创文章 · 获赞 77 · 访问量 15万+

猜你喜欢

转载自blog.csdn.net/weixin_37720172/article/details/76551115