Spark下FP-Growth - 代码天地

Spark下FP-Growth

其他 2018-12-18 10:51:14 阅读次数: 0

一旦建立了FP树之后就可以不断递归挖掘K频繁项集，对于Hadoop就会产生多次IO操作，严重影响程序运行效率，而Spark这种弹性式内存计算框架可以将中间输出和结果保存在内存中，不需要重复读写HDFS，所以Spark能更好地适用于数据挖掘需要递归的Map-Reduce算法。

Spark下FP-Growth
在spark下部署FP-growth算法的主要思路分为五步，涉及三步MR。

第一步：计算F_list，也就是计算所有item的support，这一步可以通过ＭＤ得到，实质和WordCount一样。

第二步：数据分组，将F_list中的条目分成G个组，就形成了一个Group_list，这其中每一个Group都包含一组item的集合。

第三步：并行执行FP-growth，这步和上面所说的普通FP-growth是一样的，只是需要MR来完成。这一步中mapper完成的主要功能是数据集分区，逐个处理数据分区中的事务，将事务分为item，每个item根据Group_list映射到合适的group中去，然后在reduce中并行执行FP-growth算法。

第四步：聚合，这一步将各台机器上的结果聚合成最终的结果。这一步也需要MR来完成，将各台机器上的频繁项集聚合在一起，并计算支持度。

猜你喜欢

转载自blog.csdn.net/answer3lin/article/details/84528793

Spark下FP-Growth

Spark下的FP-Growth和Apriori

spark源码解读--FP-Tree和FP-Growth

FP-growth算法

FP-Growth

Mahout fp-growth

FP-Growth 算法

关于spark运行FP-growth算法报错

FP-Growth算法介绍

FP-growth算法的理解

FP-Growth算法详解

FP-Growth算法实现

FP-growth：FP树的构建

关联分析-FP-growth算法

FP-growth 算法与Python实现

关联分析——FP-growth算法

关联分析：FP-Growth算法

Apriori FP-growth 详细介绍

关联分析（Apriori，FP-growth）

MLiA笔记_fp-growth算法

Apriori算法+FP-Growth算法

FP-Growth的C++算法实现

关联分析（一）--FP-Growth算法

java实现fp-growth算法

Apriori算法和FP-growth算法

机器学习——FP-growth算法

关联规则（三） FP-GROWTH

FP-growth 算法的简单学习

[机器学习]关联挖掘算法Apriori和FP-Growth以及基于Spark 实例

机器学习（十一）：FP增长（FP-growth）

今日推荐

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

周排行

laravle中orm简单的增删改查

文本分类特征选取之CHI开方检验

Spark核心编程-WordCount

大数据开发实战系列之电信客服(1)

读书笔记 - 把时间当作朋友 by 李笑来

python 笔记--if else

SpringBoot/Mybatis/Druid, 多数据源MultiDataSource配置思路

排序三个整数

redis集群搭建【2】-Windows中Redis集群搭建

STM32F030驱动TM1650点亮4联数码管

每日归档

更多

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)