数据挖掘导论课后习题答案-第一章

最近在读《Introduction to Data Mining 》这本书，发现课后答案只有英文版，于是打算结合自己的理解将答案翻译一下，其中难免有错误，欢迎大家指正和讨论。侵删。

第一章

在这里插入图片描述
（a）不是。这只是简单的数据库查询操作。
（b）不是。但预测一个新顾客是否可赢利则是一个数据挖掘任务。
（c）不是。
（d）不是。
（e）不是。如果骰子是均匀的，那么每个面出现是等可能的，这是一个简单的概率论问题。如果骰子不均匀，那么我们需要从数据中预测每一面出现的可能性，这种情况下看起来像一个数据挖掘任务，但是，在很早以前这个问题就被数学解决了，因此它并不是一个数据挖掘任务。
（f）是的。我们希望建立一个模型能够预测未来的股票价格。这是一个典型的预测模型领域的数据挖掘任务，我们可以用回归模型来建模。
（g）是的。我们需要建立一个正常的心率行为模型，当心率不正常时需要发出警报。这是一个异常检测领域的数据挖掘任务。如果我们有正常的和非正常的心率行为数据，也可以认为是一个分类问题。
（h）是的。在这个例子中，我们将建立一个与地震有关的包含各种地震波行为的模型，当其中某个数据异常时发出警报，这也是一个分类数据挖掘任务。
（i）不是。

在这里插入图片描述
聚类技术可以将相似的主题集合在一起，并且以更加简洁的方式向用户展示在类中出现次数最频繁的十个关键词。
分类技术可以将结果分类，比如分成“体育”“政治”等类。
关联规则挖掘技术则可以将某一搜索和其他可能的搜索关联起来，提高搜索效率。
异常检测技术可以发现用户异常的搜索模式。广告策略就是在这个基础上发展起来的。

在这里插入图片描述
（a）不是。人口普查数据是能从国家统计局等网站查到的数据。
（b）是的。
（c）不是。
（d）不是。
（e）不是。

PS：这道题仁者见仁智者见智吧，因为数据挖掘任务基于数据，而数据的私有性一直是领域中争论较大的问题，比如谷歌为了训练他们的人脸模型，费了很大力气才获得了用户的许可，将他们的脸用于训练模型。

PPS：整理不易，点个赞吧！?

数据挖掘导论课后习题答案-第一章

第一章

猜你喜欢