第一章机器学习基础

1.1何为机器学习

将无序的信息转化成有序的可用的信息。

现实生活中许多无法建立精确的数学模型,需要基于统计学的工具进行求解。
1.2关键的术语

特征:可以是十进制的数字(身高,体重),二值型(0或1),自定义调色板的枚举类型(红,黄,篮),

目标变量:也被称为类别(在分类问题中),是机器学习的输出结果
1.3机器学习的任务

回归:预测数值型数据

分类:将实例数据划分到具体的分类中。

聚类:将数据集分成多组具有相似特征的类

密度估计:寻找描述数据统计工具值的过程
1.4如何选择合适的算法

1.确定使用机器学习算法的目的:分类?回归?聚类?

2.确定输入数据的特性:是否连续?是否异常?是否缺失?

3.永远不存在最好的算法,只能尽量减小选择的范围。
1.5开发机器学习应用的基本步骤

1.获得数据(爬虫或者公开的数据源)

2.确定数据的输入格式是否符合程序要求

3.确定数据是否完整并且没有异常

4.导入算法进行训练,获得训练后的机器学习算法

5.检验算法是否符合要求,足够令人满意

6.将该算法转换为程序
1.6python的优势

可以运行伪代码足够简介,开源的项目多学习和交流的氛围好,易于专注于实现思想
1.7NumPy函数库基础

NumPy是python的一个函数库,里面有矩阵和数组运算需要的函数。

猜你喜欢

转载自blog.csdn.net/qq_37994598/article/details/84137143