1. 什么是机器学习?
1.1. 本质
根据历史看到的样本,总结规律。
1.2. 机器学习 VS 专家规则
机器学习 |
专家规则 |
说明 |
|
样本 |
全量样本 |
抽样样本 (优点:最少数据获得最多信息 |
|
规律 |
海量规则 (特征更多,规律更精细) |
几百条规则 |
规则: 特征的多少决定了分类的个数 |
总结 |
机器总结 (能够看海量样本,总结海量规则的核心原因) |
专家总结 |
|
收纳尽可能多的数据,挖掘长尾价值 |
选取最有效的数据,发挥头部价值 |
1.3. 机器学习基本原理
定义一个损失函数(错误率),尝试所有的划分方法,取损失函数最小的划分方法。
举例说明:Linear Regression(单变量线性回归)
步骤 |
函数 |
含义 |
公式 |
说明 |
1 |
假设函数 |
模型 |
x是特征 |
|
2 |
损失函数 |
衡量预测值和真实值的差距 |
求解θ0,θ1, |
|
3 |
梯度下降法 |
找到损失函数的局部极小值点 |
实际问题
问题 |
解决方法 |
穷举划分方法,导致计算量太大 |
Mini batch |
过拟合 |
正则惩罚 |