机器学习学习总结第一章什么是机器学习？

无题

本系列博客将用来记录在学习机器学习中学到的东西，相当于课堂笔记，方便之后查看。机器学习是学习深度学习的基础，我学习的目的也是为了学习深度学习的图像处理技术，所以并不会学习非常深入。学习的课程是吴恩达的机器学习课程
课程连接：吴恩达机器学习(https://www.bilibili.com/video/av9912938?p=2)

什么是深度学习？

深度学习在我们生活中的应用

百度，Google等搜索引擎在为我们搜索信息时，并且让我们满意的原因之一就是使用了机器学习。一些图像识别技术也使用到了机器学习，AI人工智能方面也有所应用。
学习机器学习必须与实际应用相结合，必须知道如何用，而不能只是懂。机器学习也应用到了生活中的各个领域，甚至到自然科学领域和军事领域。也可用来挖掘数据，通过分析来理解用户的需求。

机器学习的定义

Arthur Samuel 的定义：在进行特定编程的情况下，给予计算机学习的能力的领域。
Tom Mitchell的定义：一个号的学习问题的定义如下，一个程序被认为能从经验E中学习，解决任务T，达到性能度量值P，当且仅当，有了经验E后，经过P评判，程序在处理T时的性能有所提升。

不同类型的学习算法

监督学习：教计算机完成任务

监督学习简单的讲就是从标记的训练数据来推断一个功能的机器学习任务。
训练数据包括一套训练示例。在监督学习中，每个实例都是由一个输入对象（通常为矢量）和一个期望的输出值（也称为监督信号）组成。监督学习算法是分析该训练数据，并产生一个推断的功能，其可以用于映射出新的实例。

监督学习问题有主要有两类：一类叫做回归问题，意指要预测一个连续值的输出，比如预测房价的问题中，需要一些关于房价和面积关系的数据，并且用合适的函数来拟合，从而预测房价。关键是输出要是可以看出连续的，可以用一个函数来拟合，将每一个输入映射到一个输出上。术语回归也就意味着要预测这类连续值属性的种类。

还有一个是分类问题：预测一个离散值输出。把问题划分为若干类来解决，需要处理的是离散型数据。
例子：目前已有的数据是肿瘤的恶性和良性,恶性打叉,良性画圈.通过一个横轴即可描述该事件.同样也可以二维建模,横轴代表肿瘤大小,纵轴代表受测者年龄,当在图上给顶一个点时,我们要预测的是该受测者的肿瘤是恶性还是良性.本质上我们要找一条线,它能最大可能的分开良性肿瘤点和恶性肿瘤点.

关于回归和分类问题讲解比较好的文章推荐：什么是监督学习？如何理解分类和回归？？

无监督学习：让计算机自己学习

在监督学习的每个样本中，都被标明为了正样本和负样本，即良性或恶性肿瘤。所以对于监督学习中的每一个样本，我们都已经被清楚的告知了什么是所谓的正确的答案，即他们是良性或者恶性的。
在无监督学习中，使用到的数据和样本不一样之处在于没有属性和标签这一概念，也就是说所所有是数据都是一样的，没有区别。所有在无监督学习中我们只有一个数据集，没人告诉我们该怎么做，我们也不知道每个数据点到底是什么意思。也就是，现在只有一个数据集，能否在其中找到某种结构，对于给定的数据，无监督学习算法可以判定，该数据集包含两个不同的聚类。
聚类算法：将数据分成几个不同的聚类
栗子：Google新闻利用无监督学习和聚类算法将成千上万的新闻分为几个不同的聚类，即将相同的新闻放在一起，在页面上展示出来。

也就相当于告诉一个算法，这里有一堆数据，不知道这些数据是什么东西，也不知道数据里面都有什么，叫什么名字，甚至不知道数据的类型，但是可不可以自动的找到这些数据的类型，并且自动的按照得到的类型把这些个体分类，虽然事先我不知道有哪些类型。因为对于这些数据样本来说，我们没有给算法一个正确的结果。
这就是无监督学习。
无监督学习有非常大的应用，在社会关系分析，市场分析，天文数据分析都有应用，通过算法来将数据分类。

使用的编写环境

吴恩达老师的课程使用的是Octave的编程环境。Octave是一个免费的开放源码的软件。使用Octave或Matlab这类软件学习新算法，一些复杂的算法都可以简单的几行代码实现。使用Octave可以使学习新算法变得非常快，而使用C++,Java，python则可能要写大量的代码。

Ace_bb

发布了2 篇原创文章 · 获赞 1 · 访问量 122

私信关注