使用weka进行聚类分析 - 代码天地

使用weka进行聚类分析

其他 2018-06-29 12:22:29 阅读次数: 0

1、将.xls文件转化为.arff格式

（1）首先，将.xls文件另存为.csv格式，然后使用weka explorer的预处理面板(preprocess)，导入.csv文件

首先，在weka的安装包里，将RunWeka.ini里面的编码格式改为UTF-8，避免出现中文乱码

（2）打开.csv文件时提示如下错误

错误一，.csv文件中存在特殊字符（'），替换它

错误二，.csv文件中自动换行，删除自动换行，并取消单元格里的换行

错误三，若提示错误，修改特殊字符也没有，也无换行表现，则将上一行单元格内容复制过来，再手动还原该单元格内容即可

导入成功如下所示

（3）将.csv格式转化为.arff格式

2、进行聚类分析

（1）打开.arff文件

（2）切换到“Cluster”，点击“choose”按钮选择“SimpleKMeans"。（K均值算法）

（3）点击上面的文本框，将numClusters修改为16（我们把这16102条实例聚成16类），seed参数是要设一个随机种子，依次产生一个随机数，用来得到k均值算法中第k个簇中心的位置。（seed值不同，所算的误差平方和的结果不同）

（4）选中Cluster Mode的Use training set,选中Store clusters for visualization（存储聚类可视化），点击start按钮

可在左下角的Result list下产生的结果上右键，在新窗口中浏览结果。

3、结果分析

（1）误差平方和：这是评价聚类好坏的标准，数值越小说明同一簇实例之间的距离越小

（2）列出了各个簇中心的位置。

（3）各个簇中实例的数目及百分比

（4）可视化聚类结果，在Result list列出的结果下右击Visualize cluster assignments。

（5）将聚类的结果保存为arff文件

result.arff文件

猜你喜欢

转载自blog.csdn.net/m0_37920381/article/details/80571840

使用weka进行聚类分析

使用spss进行系统聚类分析

使用DBscan算法进行密度聚类分析

weka使用教程3--对分类结果进行分析

聚类分析2：使用Scikt-learn中的方法进行聚类分析

【数据挖掘】使用R语言进行聚类分析

使用tushare+sklearn对业务类型进行聚类分析

Python中使用K-means算法进行聚类分析

sklearn进行kmeans聚类分析

使用Weka进行数据挖掘

python调用包进行层次聚类分析

【生物信息学】使用谱聚类（Spectral Clustering）算法进行聚类分析

WEKA使用

聚类分析

Python使用RMF聚类分析客户价值

Python使用K-means聚类分析

Weka在Eclipse下使用IKAnalyzer进行分类预测

【火炉炼AI】机器学习020-使用K-means算法对数据进行聚类分析

【R统计】基于欧几里得距离进行的聚类分析

Matlab下用自带函数进行的聚类分析

Java实现k_means算法进行聚类分析

实战--利用HierarchicalClustering 进行基因表达聚类分析

OrthoMCL及orthofinder 两种软件进行聚类分析

SPSS如何进行聚类分析之案例实训？

对自定义数据进行谱系聚类分析

聚类分析（一）什么是聚类分析

什么是聚类分析？聚类分析方法的类别

weka安装&配置&使用

使用 Spark MLlib 做 K-means 聚类分析

使用Weka进行K-近邻算法和K-均值算法的使用

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

BPM为企业带来的实际利益

好程序员web前端分享css常用属性缩写

Java文件下载（excel）

css样式的动态添加及显示和隐藏等零碎用法

axios全局配置以及拦截器

使用Logstash来实时同步MySQL和log日志数据到ES

C++获取当前时间（年月日、时分秒、毫秒）

Odoo产品分析 (四) -- 工具板块(11) -- 网站即时聊天(1)

Java环境配置正确，但是java、javac、java -version均返回“不是内部或外部命令，也不是可运行的程序或批处理文件”？

01 官网下载各种CentOS教程（超详细版）

每日归档

更多

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)