之后将创作多篇与机器学习相关的文章,简单总结机器学习的回归、分类与评估模型的相关内容
1. 机器学习的兴起
计算机能够高效地做大量重复性的工作,能够从数据中学习到数据的特征、模式。
2. 能够机器学习的前提
- 有足够多的数据。随着各项信息的数字化,不仅数据量大幅增加,数据的种类也大幅增加,在进行机器学习之前首先要有相对于的数据
- 计算机方面
- 具备收集大量数据的环境
- 具备处理大量数据的环境
3. 机器学习的任务
名称 | 含义 | 实例 | 类型 |
---|---|---|---|
回归 | 对连续数据或时间序列数据做预测 | 由之前的股价折线图对股价今后的走向做预测。但股价的高低通常受多种因素的影响,所以要考虑多个因素的影响 | 带标签的学习-有监督的学习 |
分类 | 识别数据属于哪一类。前提条件是使用带标签的数据预先训练才能用于做分类 | (1)垃圾邮件识别(邮件的内容+是否为垃圾邮件的标签)(2)数字图像识别(MNIST数据集):识别图片上是哪个数字 | 有监督的学习 |
聚类 | 将一些数据按照某种特征聚集到一起 | 根据学生的考试成绩将学生划分为 理科较好学生 和 文科较好学生 | 数据不带标签-无监督的学习 |