【数据挖掘】Apriori算法初步应用

其他 2020-02-10 11:18:01 阅读次数: 0

目录

说在前面
数据处理
python code

说在前面

操作系统：win10

python版本：3.6.3

kettle版本：8.3

数据集：Soda

Apriori算法：【数据挖掘】笔记一-兴趣度度量&Apriori算法

数据处理

原数据格式
目标数据格式
转换方法
【数据挖掘】Kettle分组合并

python code

相关库
```
pip install pandas
pip install mlxtend
```

代码

import pandas as pd
from mlxtend.preprocessing import TransactionEncoder
from mlxtend.frequent_patterns import apriori, association_rules

def getData(path):
	nlist = []#读取已转换后的数据
	index=0
	with open(path,"r",encoding='utf-8') as f:
		lines = f.readlines()
		for line in lines:
			line_elems = line.split(';')
			nlist_elem=[]
			for i in line_elems:
				if i[0] != ' ':
					nlist_elem.append(i.strip().split(' ')[0])
			nlist.append(nlist_elem)
			#print(nlist_elem)
	return nlist


shopping_list = getData("file.txt") 

 # 使用TransactionEncoder将原始数据转为mlxtend接受的特定数据格式
te = TransactionEncoder() 
# 转为布尔值的array
df_tf = te.fit_transform(shopping_list)  
# print(df_tf)
# 转为dataframe形式，将列名转化为原来的商品名
df = pd.DataFrame(df_tf, columns=te.columns_)  
print(df)

# 设置最小支持度
frequent_itemsets = apriori(df, min_support=0.003, use_colnames=True)
# 设置按照支持度从大到小排序
frequent_itemsets.sort_values(by='support', ascending=False, inplace=True)
print(frequent_itemsets)

# 设置使用最小置信度
rules = association_rules(frequent_itemsets,metric='confidence',min_threshold=0.9)
# 设置按照置信度重大到小排序
rules.sort_values(by='confidence', ascending=False, inplace=True)
print(rules)

rules.to_csv('test.csv', encoding='gbk')

结果
这个数据集不是很好，可能还需要预处理一下，，，，

o0o_-_

发布了106 篇原创文章 · 获赞 41 · 访问量 4万+

私信关注

猜你喜欢

转载自blog.csdn.net/qq_33446100/article/details/101713206

【数据挖掘】Apriori算法初步应用

【数据挖掘】Apriori算法

数据挖掘算法——Apriori算法

数据挖掘之Apriori算法

数据挖掘算法Apriori的实现

数据挖掘算法-关联算法-Apriori

河北工业大学数据挖掘实验三应用 Apriori 算法挖掘频繁项集

【学习记录】数据挖掘---Apriori算法

数据挖掘算法-Apriori Algorithm（关联规则）

数据挖掘之关联规则Apriori算法

数据挖掘 -- Apriori关联规则算法

数据挖掘Java——Apriori算法的实现

数据挖掘-Apriori算法的规则与步骤实现

数据挖掘关联分析中Apriori算法理解（非算法应用）-ylance

数据挖掘之关联规则挖掘(Apriori算法)

【机器学习算法】【10】--数据挖掘算法之Apriori详解

（数据挖掘）Apriori 算法（理论及算法）简单易懂

【数据挖掘】十大算法之Apriori关联算法

数据仓库与数据挖掘之Apriori算法实例

数据挖掘十大算法之Apriori详解

Python数据挖掘入门与实践-Apriori算法勘误

关联规则进行数据挖掘 Apriori 算法

深度解析数据挖掘关联规则Apriori算法

数据挖掘笔记(5)-关联规则算法Apriori

数据挖掘实验（三）：Apriori算法 R语言

【数据挖掘】笔记一-兴趣度度量&Apriori算法

数据挖掘——关联规则分析（二）Apriori算法

关联规则挖掘-Apriori算法

频繁项挖掘-Apriori算法

关联规则挖掘（Apriori算法）

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

循环神经网络（rnn）讲解

Tigao教程四：单独的关节运动

金蝶K3WISE15.0-注册套打教程

如何在Mac上配置Kubernetes

Android应用结束自身进程的方法

SpringMVC学习十三拦截器栈

中国驻洛杉矶总领馆举行新春招待会

HttpClient get post 发送

11 - three.js 笔记 - 绘制三维字体模型

Mysql递归获取某个父节点下面的所有子节点和子节点上的所有父节点

每日归档

更多

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)