机器学习实战-第12章Fpgrowth代码勘误+递归打印效果分析 - 代码天地

机器学习实战-第12章Fpgrowth代码勘误+递归打印效果分析

其他 2018-10-08 00:21:32 阅读次数: 0

版权声明：本文为博主原创文章，可以随便转载 https://blog.csdn.net/appleyuchi/article/details/82876216

我们修改数据集，使用：

《数据挖掘导论》中的数据集：

def loadSimpDat():
    simpDat = [['a', 'b'],
                   ['b', 'c', 'd'],
                   ['a', 'c', 'd', 'e'],
                   ['a', 'd', 'e'],
                   ['a', 'b', 'c'],#与下面一条一样
                   ['a', 'b', 'c','d'],
                   ['a'],
                   ['a', 'b', 'c'],#与上面一条一样
                   ['a', 'b', 'd'],
                   ['b', 'c' ,'e']]

如果打印出来是这个，

Null Set 1
a 7
c 1
d 1
e 1
b 4
c 2
d 1
d 1
d 1
e 1
b 2
c 2
e 1
d 1

那么对应的图就是下面这个的，注意，这里阅读上面的打印结果时，

是横着看的，不是竖着看的。

而数字则是横向和字母配对的。

å¾4

好了，问题来了，我们会发现图中a：8，代码输出却是a：7

这是为什么呢？

修改书中的代码即可：

def createInitSet(dataSet):
    retDict = {}
    for trans in dataSet:
        # retDict[frozenset(trans)] = 1
        retDict[frozenset(trans)]=retDict.get(frozenset(trans),  0) +1
    print"初始化数据retDict=",retDict
    return retDict

然后输出结果就会和图中一模一样了

Null Set 1
a 8
c 1
d 1
e 1
b 5
c 3
d 1
d 1
d 1
e 1
b 2
c 2
e 1
d 1

猜你喜欢

转载自blog.csdn.net/appleyuchi/article/details/82876216

机器学习实战-第12章Fpgrowth代码勘误+递归打印效果分析

机器学习算法fpGrowth

《机器学习实战》第6章支持向量机(代码)

《机器学习实战》第5章 Logistic回归(代码)

《机器学习实战》第12章学习笔记（FP-growth）

机器学习实战第4章

机器学习实战(第2章)

python数据分析与挖掘实战逻辑回归代码勘误

《机器学习实战》第11章学习笔记（Apriori算法关联分析）

【机器学习实战】学习代码分析（2）

【机器学习实战】学习代码分析（1）

【机器学习实战】学习代码分析（4）

python数据分析实战-第8章-用scikit-learn库实现机器学习

机器学习实战第11章——使用 Apriori 算法进行关联分析

机器学习实战---读书笔记：第11章使用Apriori算法进行关联分析

《机器学习实战》第7章利用AdaBoost元算法提高分类性能(代码)

《机器学习实战》第8章预测数值型数据：回归(代码)

机器学习实战—第9章：树回归程序代码中的小错误

【吴恩达】第12章机器学习学习收获

机器学习第12章（计算学习理论）

机器学习实战---读书笔记：第12章使用FP-growth算法来高效发现频繁项集

《Python数据分析与机器学习实战-唐宇迪》读书笔记第14章--音乐推荐系统实战

《Python数据分析与机器学习实战-唐宇迪》读书笔记第18章--TensorFlow实战

学习笔记-第十二章恶意代码分析实战

《Python机器学习算法》勘误

《Python数据分析与机器学习实战-唐宇迪》读书笔记第17章--神经网络《Python数据分析与机器学习实战-唐宇迪》读书笔记第18章--TensorFlow实战

《机器学习实战》第2章阅读笔记3 使用K近邻算法改进约会网站的配对效果—K近邻算法完整系统综合示例（附详细代码及注释）

《机器学习实战》第2章阅读笔记3 使用K近邻算法改进约会网站的配对效果—分步骤详细讲解4——测试算法：验证分类器（附详细代码及注释）

《机器学习实战》第2章阅读笔记3 使用K近邻算法改进约会网站的配对效果—分步骤详细讲解1——数据准备：从文本文件中解析数据（附详细代码及注释）

《机器学习实战》第2章阅读笔记3 使用K近邻算法改进约会网站的配对效果—分步骤详细讲解3——准备数据：归一化数值（附详细代码及注释）

今日推荐

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

周排行

女程序员是这样被恶搞的

B/S 和 C/S 的优缺点

vector一直申请会怎样？

座头鲸识别比赛(Humpback Whale Identification)总结

Linux高性能服务器编程——I/O复用 select

Mysql连接数据库（当包使用）

通过URI获取的文件路径为null的解决方法

1022-Primes on Interval(素数筛选+二分查找) ZCMU

Python出现： TypeError: expected string or buffer

bzoj2434: [Noi2011]阿狸的打字机 ac自动机+树状数组

每日归档

更多

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)