python每日一记8 - 代码天地

python每日一记8

其他 2019-03-15 01:48:35 阅读次数: 0

1、聚类模型的构建
sklearn 提供了多种聚类算法，主要用到的库为cluster，cluster中有很多聚类算法，如K-Means、Spectral cluster等
聚类算法的实现需要估计器Estimator,估计器有fit和predict两个算法，如下：
在这里插入图片描述

我们利用iris数据集测试，首先利用fit训练算法，再利用predict去预测，我们的重点在于预测类别，我们发现我们预测的类别为1类别，共三个类别。注意输入的预测源为二维数据。聚类的簇数也是我们设定的，n_clusters=3，其实本身数据源也有三个类别。另外利用km.labels_可以得出聚类后的类别标签，即聚成了几类

2、评价聚类模型
最好的结果是组内相似性很大，组间相似性很小。模型就是比较优的。
利用sklearn中的metrics模块可以进行评价。如下：

在这里插入图片描述

t为真是标签，km.labels_为预测标签，也就是聚类的时候，就已经将数据分类并且有相应的标签了
最后我们得出整体效用为0.8,越接近于1表明模型越好。
另外因为簇数是我们认为划分的，如果要更加系统的评价，我们可以利用循环，分成不同的簇数，分别评价模型的好坏，选择最优的。
其余的聚类算法和聚类模型的评价方法，请自行查阅资料。如这是有真实标签的情况下，如果没有真实标签，模型怎么评价呢？

猜你喜欢

转载自blog.csdn.net/weixin_44663675/article/details/87987851

python每日一记8

Python每日一记

python每日一记13

python每日一记6

python每日一记5

python每日一记4

python 每日一记3

python 每日一记2

python 每日一记1

python每日一记12

python每日一记11

python每日一记10

python每日一记9

python每日一记7

每日一记

每日一记(1)

每日一记--AOP

每日一记--Axjx

每日一记--迷茫

每日一记 7.31

每日一记8.1

每日一记8.7

每日一记8.22

每日一记8.6

Python每日一记22>>>网格搜索

Python每日一记14>>>贝叶斯算法

Python每日一记21>>>交叉验证

Python每日一记20>>>哑变量

Python每日一记18>>>merge小问题

Python每日一记17>>>神经网络MPL

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

curl的POST请求，封装方法

8.1.1. Integer Types

Java基础 Day05(个人复习整理)

Python - Django - 中间件 process_exception

小L的试卷

【Shell编程】（函数）判断用户是否存在

python(css样式)

spring ant path 匹配原则 - 【笔记】

《JavaScript与JScript从入门到精通》(美)James.Jaworski.中译本.扫描版.pdf

Eclipse运行带参数的java程序

每日归档

更多

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)