【机器学习课程-华盛顿大学】：2 回归 2.6 非参数化：最近邻和核回归 - 代码天地

【机器学习课程-华盛顿大学】：2 回归 2.6 非参数化：最近邻和核回归

其他 2018-06-14 05:07:42 阅读次数: 2

背景：如果想要局部平滑，而且数据量很大，我们可以有如下方法。

一、最简单方法：最近邻回归

1、1找1近邻的步骤

比如：卖房子的时候，房产中介会找一个最像的房子来定价我们的房子

2、距离

对于一些重要的特征，我们可以加大权重(下面是欧氏距离)：

其他距离种类：曼哈顿距离、汉明距离等。

3、1NN：1近邻

初始化最小距离，最近邻为空，查询房屋为q

对所有的房屋进行遍历：

求所有房屋与房屋q的距离

如果距离<最小距离，则更新最小距离以及最相似房屋索引；否则最小距离保持不变，且最相似房屋索引不变；

全部遍历结束后，返回最相似房屋i。

缺点：

（1）对大块区域没有数据或很少数据时敏感，拟合的不好

（2）对噪声敏感

4、kNN：k近邻

优点：对噪声鲁棒

缺点：不连续，比如当待售房子是100平，跟它最相似的3个房子分别为101平，140平和180平。原则上，应该主要参考101平的房子，但是这种情况下没有这种倾向。

5、加权KNN

离得更近的具有更大的权重，离得远的具有更小的权重。权重最简单的计算方法为距离的倒数，如下：

继续升级权重，提出核权重的概念。其实就是把权重的公式概念化。

二、核回归

核回归其实就是升级版的加权KNN，区别就在于，核回归不是加权的N个邻居，而是所有的点。

要确定两个：（1）核，（2）lambda。其中，核的选择比lambda的选择更重要。

lambda的选择：根据验证集验证时的验证损失来确定。

三、计算复杂度

1NN的计算复杂度：O(N)

KNN的计算复杂度：O(N*logk)

如果N很大，则计算复杂度将非常高，因此，我们以后将引入聚类。

将KNN用来分类：比如邮件分类，使用KNN进行权重投票。

四、测试

核回归的lambda选择

猜你喜欢

转载自blog.csdn.net/weixin_41770169/article/details/80658712

【机器学习课程-华盛顿大学】：2 回归 2.6 非参数化：最近邻和核回归

【机器学习课程-华盛顿大学】：2 回归 2.6 总结

【机器学习课程-华盛顿大学】：2 回归 2.5 Lasso Regression

【机器学习课程-华盛顿大学】：2 回归 2.2 多元线性回归

【机器学习课程-华盛顿大学】：2 回归 2.4 岭回归Ridge Regression

【机器学习课程-华盛顿大学】：2 回归 2.1 线性回归模型

【机器学习课程-华盛顿大学】：2 回归 2.3 性能评估（2）

【机器学习课程-华盛顿大学】：2 回归 2.3 性能评估（1）

【机器学习课程-华盛顿大学】：1 案例研究 1.2 回归（2）房价预测实战

【机器学习课程-华盛顿大学】：1 案例研究 1.2 回归（1）房价预测描述

【机器学习课程-华盛顿大学】：3 分类 3.2 逻辑回归分类器过拟合

【机器学习课程-华盛顿大学】：3 分类 3.2 逻辑回归分类器

【机器学习课程-华盛顿大学】：1 案例研究 1.6 深度学习（2）深度学习特征作为输入训练逻辑回归分类

【机器学习课程-华盛顿大学】：4 聚类和检索 4.4 MoG混合高斯模型编程测试（2）

Andrew机器学习课程章节2——单变量线性回归

机器学习算法--回归2--岭回归与IASSO回归

【机器学习】正则化的线性回归 —— 岭回归与Lasso回归

机器学习——线性回归和逻辑回归

机器学习：线性回归和逻辑回归

机器学习--Lasso回归和岭回归

机器学习-线性回归和逻辑回归

机器学习 - 2 - 线性回归

【机器学习】2 逻辑回归

【机器学习课程-华盛顿大学】：4 聚类和检索 4.6 总结与展望

【机器学习课程-华盛顿大学】：4 聚类和检索 4.5 LDA

【机器学习课程-华盛顿大学】：4 聚类和检索 4.3 k-means

【机器学习课程-华盛顿大学】：4 聚类和检索 4.2 编程测试：LSH代码实现

【机器学习课程-华盛顿大学】：4 聚类和检索 4.2 LSH局部敏感哈希

【机器学习课程-华盛顿大学】：4 聚类和检索 4.3 k-means代码实现

【机器学习课程-华盛顿大学】：4 聚类和检索 4.5 LDA测试

今日推荐

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

周排行

[编程题]学英语

[codeforces 1288A] Deadline 约数+模

Python的web开发

Docker在Centos 7上的部署

python编码

解决Ubuntu16.04 fatal error: json/json.h: No such file or directory

mysql并发插入

rest接口如何适应jsonp的方案

linux 终端上网设置

高数——等号两边同时求导、积分的解释

每日归档

更多

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)