机器学习实战——KNN算法预测电影类型 - 代码天地

机器学习实战——KNN算法预测电影类型

其他 2018-12-26 19:50:18 阅读次数: 0

预测电影类型

现有爱情片和动作片（不是爱情动作片，雾）的打斗场面和接吻场面的次数统计，然后给出一个电影打斗场面和接吻场面出现的次数，预测其类型。

那么如何预测呢？当然用KNN了。

KNN算法的原理就是，存在一个训练样本集，我们知道样本集中每一数据与其所属分类的对应关系，然后输入没有标签的新数据，我们可以通过将它的特征与样本集中数据的特征进行比较，提取样本中最相似的分类标签，一般提取前K个，k通常不大于20。简单地说就是计算它与样本集中哪些数据最相似，将抽象的相似性用距离可视化，可计算化，选取前K个最相似的标签。

代码：

from numpy import *
import operator
import matplotlib
import matplotlib.pyplot as plt

#样本训练集
def createDataSet():
    group=array([[1.0,1.1],[1.0,1.0],[0,0],[0,0.1]])
    labels=['A','A','B','B']
    return group,labels

#inx：测试集，dataset：训练集，labels：标签，k：选取前k个
def classify0(inx,dataSet,labels,k):
    dataSetSize=dataSet.shape[0] #dataset的行数
    # tile函数将inx变成datasetsize行，1列的矩阵，做差之后矩阵即为
    #[[xi-x0,yi-y0],..[xi-xd,yi-yd]]
    diffMat=tile(inx,(dataSetSize,1))-dataSet
    #矩阵每个元素都平方
    sqDiffMat=diffMat**2
    #axis=1表示按行加，0表示按列加
    sqDistances=sqDiffMat.sum(axis=1)
    #开方求距离
    distances=sqDistances**0.5
    #argsort()返回数组从小到大的索引值
    sortedDistIndicies=distances.argsort()
    classCount={}
    for i in range(k):
        #选取前k个，voteIlbale表示距离从前往后的标签
        voteIlbale=labels[sortedDistIndicies[i]]
        #统计标签出现的次数
        classCount[voteIlbale]=classCount.get(voteIlbale,0)+1
        #按照标签出现的次数排序，反向排序
        sortedClassCount=sorted(classCount.items(),key=operator.itemgetter(1),reverse=True)
        #返回出现次数最多的标签
        return sortedClassCount[0][0]

猜你喜欢

转载自blog.csdn.net/qq_36718317/article/details/80415351

机器学习实战——KNN算法预测电影类型

【人工智能】机器学习之Python使用KNN算法进行电影类型预测，对鸢尾花进行分类

机器学习实战-KNN算法

机器学习实战 knn算法

机器学习实战——KNN算法

[机器学习实战] KNN算法

机器学习实战---KNN算法

机器学习(六)-基于KNN分类算法的自动划分电影的题材类型实现

机器学习算法及实战——kNN算法

机器学习实战之KNN算法

《机器学习实战》——kNN（k近邻算法）

机器学习实战笔记（一）KNN算法

机器学习实战中的KNN算法

《机器学习实战》—— KNN(K近邻算法)

机器学习实战笔记——KNN算法

机器学习实战——KNN分类算法

机器学习实战 -- kNN分类算法

机器学习实战-K近邻算法（KNN）

【机器学习实战】—KNN分类算法

机器学习实战笔记--KNN近邻算法

《机器学习实战》（一）knn算法

机器学习实战（笔记）------------KNN算法

机器学习-KNN算法详解与实战

机器学习实战之KNN算法笔记

机器学习之KNN算法及TensorFlow实战

机器学习之KNN算法及TensorFlow实战

【机器学习实战】kNN算法_c++

机器学习实战-KNN算法代码解析

机器学习knn算法实战python

机器学习实战-KNN算法-20

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

记一下去大梅沙的准备（2018-05-26）

Spring 注解事务

基于HTTP协议的客户端缓存

阿里云rds 备份和还原

[PHP] 几个拖慢 PHP 程序/API 运行速度的点

python 代码风格------------PEP8规则

js控制json生成菜单——自制菜单（一）

将字符串: 'k:1|k1:2|k2:3|k3:4 ' ,处理成 python 字典: {'k':1, 'k1':2, ...}

微信小程序转支付宝小程序

Qt551.窗口滚动条

每日归档

更多

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)