距离度量\(L_1\) 和\(L_2\)的区别
一些感性的认识,\(L_1\)可能更适合一些结构化数据,即每个维度是有特别含义的,如雇员的年龄、工资水平等等;如果只是一个一般化的向量,\(L_2\)可能用得更多。但这些仍然需要视具体情况而定。
Nearest Neighbor
K的选取,1、3、5,在一些特殊例子上的影响
用validation data来evaluate方法,选模型、选模型的超参数等,选出最好的一个model
在test dataset上只用一次
b, 处理 imbalanced data , data independent bias terms
如果cat的图片多,也许对应的b就会大一些