机器学习算法总结知识点索引

百面机器学习算法总结索引(声明:以下所有内容及其链接内容来自于百面机器学习一书,仅供自己方便学习和复习,不做任何商业用途,所有链接内容继承本声明)
第一节:特征归一化

1.为什么需要对数值类型的特征做归一化?

2.在对数据进行预处理时,应该怎样处理类别型特征?
3.如何处理高纬度组合特征?什么是组合特征?
4.
5.有哪些文本表示模型?它们各有什么优缺点?
6.Word2vec是如何工作的?它和LDA有什么区别和联系?
7.在图像分类任务中,训练数据不足会带来什么问题?如何缓解数据量不足带来的问题?
第二节:模型评估
8.准确率Accuracy的局限性
9.精确率和召回率的权衡
10.RMSE平方根误差的意外?
11.什么是ROC曲线?如何绘制ROC曲线?如何计算AUC?ROC曲线相对P-R曲线有什么特点?
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

猜你喜欢

转载自blog.csdn.net/qq_29678299/article/details/88659426
今日推荐