python机器学习0基础到入门的心得----入门篇1 k近邻算法

其他 2018-06-23 00:12:10 阅读次数: 2

K-近邻算法

这个算法是机器学习最简单的一个算法, 也可以说机器学习入门的算法

本章节代码连接
需要配合机器学习实战这本书来学习

优点

精度高, 可自定义k值
对异常值不敏感
不需要训练

缺点

时间复杂度高,O(n**m), 需要遍历n个样本, m个特征, n次距离计算
计算量大, 内存开销大
必须指定k值, k值选择不当可能会造成分类精度不准确
1. 取小: 容易受异常点影响
2. 取大: 容易收到最近的数据太多导致比例变化

适用的数据类型:

标称型和数值型

适用场景:

几千~几万的样本, 具体场景具体业务自己去测试把, 反正不适合大数据量

欧氏距离公式: 这里写图片描述

本人归纳总结:

假设有一个模型, 模型中每个样本都有类别
查看数据有没有缺失值, 异常值, 如果有需要进行处理
往模型里扔一个没有类别的样本, k近邻算法会计算模型里面所有样本的欧氏距离, 在单独计算没有类别的样本的欧氏距离, 找出挨着没有类别的样本最近的那个模型里面k个样本,选出出现次数最多的类别就是分类器分类出来的(有一个样本集, 并且样本集中每个数据都存在标签, 输入没有标签的新数据, 将新数据的每个特征与样本集中数据对应特征进行比较, 然后提取样本集中特征最相似数据(最近邻)的分类标签, 只选前k个最相似的数据, 选择k个最相似的数据中出现次数最多的分类, 作为新数据的分类)
如果是文字图片的样本, 需要转换成向量

猜你喜欢

转载自blog.csdn.net/qq351469076/article/details/80762402

python机器学习0基础到入门的心得----入门篇1 k近邻算法

K-近邻算法入门

[机器学习] K近邻算法

机器学习——K近邻算法

机器学习k近邻算法

机器学习算法——K近邻

机器学习-K近邻算法

机器学习---K近邻算法

机器学习 k近邻算法

【机器学习】K近邻算法

机器学习入门——K近邻算法

机器学习—K-近邻算法[入门]

【python与机器学习入门1】knn（k近邻）算法

K-近邻算法-1

python实现k近邻算法

K近邻算法的Python实现

k-近邻算法（python）

K近邻算法实现-Python

K近邻（KNN）算法的学习

【机器学习算法】【2】--K近邻算法

机器学习---算法---K-近邻算法

机器学习算法之 K近邻算法

机器学习入门(1) k-近邻算法

机器学习(1)：k-近邻算法

机器学习（1）——K近邻算法

python 机器学习 sklearn - k近邻算法

python机器学习——k-近邻算法

Python3入门机器学习 - k近邻算法

机器学习入门（一）之 K近邻算法(KNN算法)

K-近邻算法入门程序

今日推荐

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

“百模大战”必有一战 | 2024中国“百模大战”竞争格局分析

周排行

Family Tree 题解

BZOJ 1093 最大半连通子图 SCC + DP

幂等处理

Spring----学习（2）----XML 配置Bean 自动装配

SQL Server 远程更新目标表数据

HIbernate3.6 环境搭建

特殊符号正则表达式

【Linux】第一章进程的理解

843. n-皇后问题（dfs+输出各种情况）

空间数据库2

每日归档

更多

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)

2024-04-17(5)