机器学习拐弯点

1.线性回归:满足齐次,满足可加性

2.多项式线性回归:变量代替法换成一元

3.验证集误差不能作为测试集误差的原因?

答:验证集选模型时,人为选最高,而测试集是自然的选择过程,为了方便,做一次测试集误差就代表了多次,效果都差不多

4.不对称类数据:坏的数据少,好的数据多,为防止模型测试效果不太好,所以用测试了多少个病人,还有测的准确率,双重标准,使得结果可信度一定可信

数据对称:好的和坏的差不多1:1;在这种情况下测试,想要把把都对,那是真本事

数据局限性:对于想要测试的目标结果可能性很多时,不能够收集各种目标数据集,只能从反面做模型,模型只能测试数据集有的可能性

大规模数据:越多拟合的越好,限制点越多

5.推荐系统

在某段时间内使用数据,做出模型,每个时间段做个,具有时效性

6.支持向量机:核函数:建立新特征?

为什么合适,没明白

7.图像文字识别

流程。。。滑动窗口做特征,做切割,特征的选择具有功能性。

8.特征

特征的选择具有功能性,特征的选择和输出具体相关性

9...

猜你喜欢

转载自blog.csdn.net/chanleoo/article/details/89076348