什么是机器学习?(一)

机器学习是一种概念:不需要写任何与问题有关的特定代码,泛型算法(Generic Algorithms)就能告诉你一些关于你数据的有趣结论。不用编码,你将数据输入泛型算法当中,它就会在数据的基础上建立出它自己的逻辑。

泛型,即没有特定类型,泛型算法是一种对很多不同问题都适用的算法,也叫作通用算法。

比如说,有一种算法被称为分类算法,它可以将数据分为不同的组。分类算法可以用来识别手写数字;不用修改一行代码,它也可以用来区分垃圾邮件和非垃圾邮件。如果给同样的算法输入不同的训练数据,它就能得出不同的分类逻辑。

机器学习算法是个黑盒,它可以重复使用于很多不同的分类问题。

「机器学习」是一个涵盖性术语,它覆盖了大量类似的泛型算法。

两类机器学习算法

你可以把机器学习算法分为两大类:有监督机器学习(Supervised Machine Learning)无监督机器学习(Unsupervised Machine Learning)。要区分两者很简单,但也非常重要。

有监督机器学习

假设你是一名房地产经纪人,你的生意蒸蒸日上,因此你雇了一批新员工来帮忙。但是问题来了——虽然你可以一眼估算出房子的价格,但新员工却不像你这样经验丰富,他们不知道如何给房子估价。

为了帮助你的新员工,你决定写一个可以根据房屋大小、地段以及同类房屋成交价等因素来评估一间房屋的价格的小软件。

近三个月来,每当你的城市里有人卖了房子,你都记录了下面的细节——卧室数量、房屋大小、地段等等。但最重要的是,你写下了最终的成交价:

这就是我们的「训练数据」。

使用这些训练数据,我们要来编写一个能够估算该地区其他房屋价值的程序:

我们希望使用这些训练数据来预测其他房屋的价格。

这就是有监督机器学习。你已经知道了每一栋房屋的售价,换句话说,你已经知道了问题的答案,并且可以反向找出解题的逻辑。

为了编写你的软件,你将包含每一套房产的训练数据输入到你的机器学习算法当中去。算法会尝试找出需要做哪些数学运算来得出价格。

无监督机器学习

让我们回到房地产经纪人的例子。如果你不知道每栋房子的售价怎么办?即使你所知道的仅仅是每栋房屋的大小、位置等信息,你也可以搞出一些很酷炫的花样来。这就是我们所说的无监督机器学习

即使你并不是在尝试预测未知的数据(如价格),你也可以运用机器学习做一些有意思的事。

首先,你可以用个算法自动从数据中划分出不同的细分市场。也许你会发现,当地大学附近的购房者特喜欢户型小、卧室多的房子,而郊区的购房者偏好三卧室的大户型。了解这些不同消费者的喜好可以直接帮助你的营销。

你还可以做件很酷炫的事,就是自动找出非同寻常的房屋。这些与众不同的房产也许是奢华的豪宅,而你可以将最优秀的销售人员集中在这些地区,因为他们的佣金更高。

在接下来的内容中我们主要讨论有监督机器学习,但这并不是因为无监督机器学习比较没用或是无趣。实际上,随着算法的改良,无监督机器学习正变得越来越重要,因为即使不将数据和正确答案联系在一起,它也可以被使用。

我们将继续以预测房价为例,解释什么是机器学习。

什么是机器学习?(二)

作者:Adam Geitgey

原文:https://medium.com/@ageitgey/machine-learning-is-fun-80ea3ec3c471#.ak1of1xbg

翻译:巡洋舰科技——赵95 


相关文章:

什么是机器学习?(二)

什么是机器学习?(三)

什么是机器学习?(四)

什么是机器学习?(五)

猜你喜欢

转载自blog.csdn.net/hajk2017/article/details/81093664