机器学习-斯坦福课程系列1【基本概念】

人工智能近几年比较火,如AR,VR,AlphaGo,自动驾驶,智能家居等,隔三差五就有新闻。犹豫了很久,觉得自己应该学点什么,却迟迟没有行动,最近才决定把吴恩达(Andrew Ng)在Coursera上的《机器学习》课程撸一遍(其实加入注册该课程大半年了),以加深对这个行业的理解。从这门课出发,完全是因为这门课名气大。目前来看,这是一门含金量极高的课程。

首先,要弄清楚一个概念,什么是“机器学习”。在没有查Wikipedia之前,我的理解是,“机器学习人的思维方式,然后自主做出判断”。止步于此,觉得不过瘾,估计小学生也能这样解释。“深度学习”并没有统一的定义,先列举2种非常著名的定义。

  1. The field of study that gives computers the ability to learn without being explicitly programmed.

  2. A computer program is said to learn from experience E with respect to some class of tasks T and performance measure P if its performance at tasks in T, as measured by P, improves with experience E.

第1个定义比较容易理解,译为“不通过显式编程,让计算机拥有学习能力”。课上Andrew Ng举了Google News的例子。Google News的算法并没有明确如何编排新闻,而是通过分析抓取的网页的信息自动实现分类,即具体分类方法并没有明确写成代码。

第2个定义比较费解,举个例子:

Example: playing checkers.
E = the experience of playing many games of checkers
T = the task of playing checkers.
P = the probability that the program will win the next game.

例子不再翻译,对照看定义,会好很多。“计算机的学习能力E和特定任务T和任务完成概率P相关,如果任务用T和任务完成概率用P衡量,它们会随着经验E的增加而越来越厉害。”计算机和人玩国际象棋,玩得越多,胜率越大。

机器学习分为两大类:

  1. Supervised Learning(监督式学习);
  2. Unsupervised Learning(非监督式学习);

监督式学习,先输入数据集,并作为参照,判断后续输入集的结果。以“肿瘤大小判断良性恶性”为例,先输入一系列数据集,即肿瘤大小数值和肿瘤是否为良性的数据。根据数据,画出二维图。在此二维图的基础上分析某个肿瘤大小数值是否对应为良性或者恶性。

这里写图片描述

这里的“Classification”,是分类的意思。如果要分析的结果是离散的值,如“良性”或者“恶性”,则称为分类法;对应地有另外一种方法,“Regression”,“回归”的意思,用于分析预测的值为连续的值。

这里写图片描述

分类(Classification)和回归(Regression)是根据输出的结果的特征来对机器学习做分类,后续还会学习到其他类别,此处不再展开。

与监督式学习相对应,也有“非监督式学习“。

Unsupervised learning allows us to approach problems with little or no idea what our results should look like. We can derive structure from data where we don’t necessarily know the effect of the variables.

非监督式学习牛逼之处在于:在解决问题之前,并不知道结果会是怎样的,而是通过分析数据集的变量关系来组织数据。

这里写图片描述

图中有4个例子,以最熟悉的”社交网络“为例,玩早期的人人网或当前的脉脉时,都会为你计算x度人脉,用的就是这种形式。x度人脉的是根据用户的基本信息和好友情况进行分析的。在非监督式算法的支撑下,可能得出我们意向不到的情况,就像我们生活中偶然得知,”呃,我跟她原来是亲戚耶“,就是这种感觉。

今天主要介绍了机器学习的定义和机器学习的分类。概念相对于应用而言,有些枯燥,但正确的理论基础是正确使用的前提,让我们一步步揭开机器学习的神秘面纱吧。

:文中所有图片来自于Coursera上斯坦福大学《机器学习》课程。

猜你喜欢

转载自blog.csdn.net/androidchanhao/article/details/54381710