【机器学习实战】FP-growth算法详解 - 代码天地

【机器学习实战】FP-growth算法详解

其他 2018-12-05 15:55:25 阅读次数: 0

版权声明：本文为博主原创文章，未经博主允许不得转载。 https://blog.csdn.net/ACBattle/article/details/81515961

背景

apriori算法需要多次扫描数据，I/O 大大降低了时间效率

1. fp-tree数据结构

1> 项头表

记录所有的1项频繁集出现的次数，并降序排列

2> fp tree

根据项头表，构建fp树

3> 节点链表

所有项头表的1项频繁集都是一个节点链表的头，依次指向fp树中的位置，而且方便查找和更新

2. 项头表的建立

这里写图片描述
排序后的数据集进行了两步操作:
1> 删除每行关键字中支持度小于minSup的
2> 对关键字中剩下的元素按照支持度排序

3. fp tree和节点链表一起构建

开始节点为空
首先插入第一行关键字
这里写图片描述
接着插入第二行关键字，如果有重复的前缀路径，则路径上的节点+1

.
.
.
,
,
.
.
类似的我们插入所有的数据之后，fptree和链表也都建好了,下图即为最后的tree和节点链表

4.FP Tree的挖掘

对项头表从底部依次向上挖掘频繁集，对于项头表对应于fp树的每一项，我们要找到它的条件模式基（所有的路径前缀），更新该路径的节点数目。
F：
这里写图片描述
D:

…

最后是A，因为条件模式基为空，所以可不用挖掘
由此，我们得到了所有的频繁集（> 0.2）,如果只要最大的频繁k项集，从上面分析可以看出，最大的是5项集，A----C----E----B----F

5.FP Tree步骤总结

1> 扫描数据，得到所有频繁一项集的计数，按照支持度保留满足的项，将频繁一项集放入项头表，并按降序排列
2> 扫描数据，重置原始数据（删除非频繁一项集，并按支持度排序）
3> 读入排序后的数据集，插入FP树，并构建节点链表
4> 挖掘频繁信息，按照项头表，从底向上依次寻找频繁集。

参考博主

猜你喜欢

转载自blog.csdn.net/ACBattle/article/details/81515961

【机器学习实战】FP-growth算法详解

机器学习-关联之FP-Growth算法原理及实战

机器学习——FP-growth算法

FP-Growth算法详解

机器学习之Apriori算法和FP-growth算法

《机器学习实战》使用Apriori算法和FP-growth算法进行关联分析（Python版）

机器学习实战（十一）FP-growth（频繁项集）

机器学习实战笔记-11-Apriori与FP-Growth算法

机器学习实战（十一）使用FP-growth算法来高效发现频繁项集

机器学习之FP-growth频繁项集算法

FP-growth算法

FP-Growth 算法

FP-growth 算法的简单学习

《机器学习实战》学习笔记（十一）之使用FP-growth算法来高效发下频繁项集

机器学习（十一）：FP增长（FP-growth）

机器学习实战---读书笔记：第12章使用FP-growth算法来高效发现频繁项集

FP-Growth算法介绍

FP-growth算法的理解

FP-Growth算法实现

【机器学习算法应用和学习_1】FP-growth算法

《机器学习实战》第12章学习笔记（FP-growth）

【机器学习】数据挖掘算法——关联规则（三），FP-growth算法

机器学习9—关联分析之Apriori算法和FP-Growth算法

机器学习实战(10) FP-growth 基于python3

机器学习之使用FP-growth算法来高效发现频繁项集

python关联分析 __机器学习之FP-growth频繁项集算法

机器学习——Weak7.使用FP-growth算法来高效发现频繁项集

[机器学习]关联挖掘算法Apriori和FP-Growth以及基于Spark 实例

Python机器学习 — 关联规则（Apriori、FP-growth）

关联规则算法Apriori以及FP-growth学习

今日推荐

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

周排行

计算机组成与设计（七）—— 除法器

Integer Approximation(分治+枚举)

大话数据库索引

windows10系统JDK的配置及下载地址

mysql实现秒值转换中原六仔平台搭建

Codeforces Round #556 (Div. 1)

百练1064 网线主管

Codeforces 995F Cowmpany Cowmpensation

子集生成之增量构造法，位向量法，二进制法

ERROR: cmd.exe failed with args /c "/APK\gradle\rungradle.bat...

每日归档

更多

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)