查看neighbors大小对K近邻分类算法预测准确度和泛化能力的影响 - 代码天地

查看neighbors大小对K近邻分类算法预测准确度和泛化能力的影响

其他 2018-07-12 10:49:29 阅读次数: 0

代码：

 1 # -*- coding: utf-8 -*-
 2 """
 3 Created on Thu Jul 12 09:36:49 2018
 4 
 5 @author: zhen
 6 """
 7 """
 8     分析n_neighbors的大小对K近邻算法预测精度和泛化能力的影响
 9 """
10 from sklearn.datasets import load_breast_cancer
11 
12 from sklearn.model_selection import train_test_split
13 
14 from sklearn.neighbors import KNeighborsClassifier
15 
16 import matplotlib.pyplot as plt
17 
18 cancer = load_breast_cancer()
19 
20 x_train, x_test, y_train, y_test = train_test_split(
21         cancer.data, cancer.target, stratify=cancer.target, random_state=66)
22 
23 training_accuracy = []
24 
25 test_accuracy = []
26 
27 # n_neighbors取值从1~10
28 neighbors_settings = range(1, 11)
29 
30 for n_neighbors in neighbors_settings:
31     # 构建模型
32     clf = KNeighborsClassifier(n_neighbors=n_neighbors)
33     clf.fit(x_train, y_train)
34     # 记录训练集精度S
35     training_accuracy.append(clf.score(x_train, y_train))
36     # 记录泛化能力
37     test_accuracy.append(clf.score(x_test, y_test))
38     
39 plt.plot(neighbors_settings, training_accuracy, label="training accuracy")
40 plt.plot(neighbors_settings, test_accuracy, label="test accuracy")
41 
42 plt.xlabel("n_neighbors")
43 plt.ylabel("Accuracy")
44 
45 plt.legend()

结果：

总结：在仅考虑单一近邻时，训练集上的预测结果十分完美（接近100%）。但随着邻居个数的增多，模型变得更简单（泛化能力越好），训练集精度也随之下降。为求得较好的预测精度和泛化能力，最佳性能在neighbors为6左右！

猜你喜欢

转载自www.cnblogs.com/yszd/p/9298214.html

查看neighbors大小对K近邻分类算法预测准确度和泛化能力的影响

机器学习算法的分类准确度

03-分类准确度

K-Nearest Neighbors近邻算法（KNN）

推荐算法的准确度评价指标：

数学基础-模型准确度影响因素

sklearn.neighbors.KNeighborsClassifier(k近邻分类器)

【ML】K近邻算法 KNN （K-nearest Neighbors）

KNN(k-nearest neighbors) K近邻算法深入

k-nearest neighbors algorithm - k 最近邻算法

机器学习算法：K近邻(k-nearest neighbors)初探

机器学习算法：K近邻(k-nearest neighbors)

多分类 & 多标签准确度计算

python - 实现文本分类（准确度不高）

K近邻算法回归和分类

K近邻分类算法

K-Nearest Neighbors近邻算法（KNN）（简单版）

准确度和精度有什么区别？

模型准确度测算

K-近邻算法---分类

KNN（K近邻）分类算法

《算法图解》第10章 K最近邻（K nearest neighbors,KNN）算法

分类预测 | MATLAB实现BO-KNN贝叶斯优化最近邻分类预测（含K折交叉验证准确率）

CV最简单的分类算法——knn（k nearest neighbors）

用K-近邻算法分类和回归

第四十六篇入门机器学习——kNN - k近邻算法（k-Nearest Neighbors）

大数据技术之机器学习K 近邻（k-nearest neighbors）算法

K近邻算法（K-Nearest Neighbors, KNN）原理详解与应用

sklearn实现K-近邻算法、鸢尾花分类、facebook签到位置预测

K-近邻算法预测电影类型

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

周排行

Python环境安装与基础语法（1）——计算机基础知识

IMU预积分

ADAS中的LDW、FCW、BSD、LCA、ACC、AEB、APA、DMS代表的含义

B站笔试两道题

skyeye arm 硬件虚拟机环境的搭建

Web前端静态页面示例

数组-合并排序数组 II-简单

springcloud之版本问题启动报错

面向对象-------------匿名对象(六)

输入URL到页面呈现中间发生了什么？

每日归档

更多

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)