萌新向Python数据分析及数据挖掘 第三章 机器学习常用算法 第一节 KNN算法 (上)理解篇

理解
用一个实际生活的例子来解释
假设你面前有一堆男人
分类问题:
这些男人的基本信息全部掌握,有一些是渣男,有一些是好男人,有一些是正常人
现在新来了几个男人,基本信息全部掌握,没有标注男人类型,需要从已知的男人作为参考,判断新来的男人的类型
KNN的思想就是:对每一个新来的男人,找出和他基本信息最相近的K个男人,看看他们这几个接近的男人的类型,然后以最多的类型作为预测
回归问题:
这些男人的基本信息全部掌握,包括他们的年收入
现在新来了几个男人,基本信息全部掌握,不包括年收入
KNN的思想就是:对每一个新来的男人,找出和他基本信息最相近的K个男人,看看他们这几个接近的男人的年收入,然后以平均数或加权平均数作为预测
训练测试分离
在给新来的男人预测时,先把原有的男人打乱顺序,随机抽取一定比例作为练习,看看自己看男人的眼光是否准确,再来对付新来的男人
超参数
k
选几个最相近的男人作为参考
权重
对于挑出来参考的这几个男人 更着重参考最接近的
p
评价最相近时使用闵科夫斯基距离的次方数

猜你喜欢

转载自www.cnblogs.com/romannista/p/10730074.html