数据挖掘回归分析第五章学习通习题

文章目录

一.单选题

1.某超市研究销售纪录数据后发现,买啤酒的人很大概率也会购买尿布,这种属于数据挖掘的哪类问题( )

A. 关联规则发现;
B. 聚类;
C. 分类;
D. 自然语言处理;

答:关联规则发现;

2.置信度(confidence)是衡量哪种兴趣度度量的指标( )

A. 简洁性;
B. 确定性;
C. 实用性;
D. 新颖性;

答:B

3.下列指标中,能够度量一个规则的强度,同时衡量两个集合之间的独立性的是( )。

A. 提升度;
B. 杠杆度;
C. IS度量;
D. 确信度;

答:D

4.下列几种数据挖掘功能中被广泛的用于购物篮分析的是( )。

A. 关联分析;
B. 分类和预测;
C. 聚类分析;
D. 演变分析;

答:A

5.设X={1,2,3}是频繁项集,则可由X产生多少个关联规则( )。

A. 4;
B. 5;
C. 6;
D. 7;

答:C

二.多选题

6.下表是一个购物篮,假定支持度阈值为40%,其中哪几个是频繁闭项集( )。

在这里插入图片描述
A. abc;
B. ad;
C. cd;
D. de;

答:AD

7.以下关于非频繁模式说法,正确的是( )。

A. 其支持度小于阈值;
B. 都是不让人感兴趣的;
C. 其支持度大于阈值;
D. 对异常数据项敏感;

答案:AD

三.填空题

1.Aprior算法包括____和 ____两个基本步骤。

答案:(1) [ “连接” ]
(2) [ " 剪枝" ]

2.如果L2={ {a,b},{a,c},{a,d},{b,c},{b,d}},则连接产生的C3=____。

答案:{ {a,b,c},{a,b,d},{a,c,d},{b,c,d}}

3.同时满足____和____的规则称之为强关联规则。

答案:(1) 最小支持度阈值
(2) 最小置信度阈值

4.在挖掘闭模式算法中,直接搜索闭频繁项集,并对结果进行剪枝是最常用的方法,其中剪枝的策略包括____和____。

答案:(1) [ "项合并 " ]
(2) [ “子项集剪枝” ]

5.频繁出现在数据集中的模式称为:____。

答案:(1) 频繁模式

6.大型数据库中的关联规则挖掘包含 找出所有____和由____产生____两个过程。

答案:(1) 频繁项集
(2) 频繁项集
(3) 强关联规则

7.计算{面包(A)=>啤酒(E)}的支持度:____(保留小数点后一位)

在这里插入图片描述

答案:(1) [ “0.2”, “0.20” ]

四.判断题

1.关联规则挖掘过程是发现满足最小支持度的所有项集代表的规则

A. 对
B. 错

答案:B. 错

2.利用先验原理可以帮助减少频繁项集产生时需要探查的候选项个数。

答案:A. 对

3.先验原理可以表述为:如果一个项集是频繁的,那包含它的所有非空子集也是频繁的。

答案:A对

4.两个项集的全置信度越大,说明两个项集的关系越紧密,反之则关系越疏远。

答案:A对

猜你喜欢

转载自blog.csdn.net/qq_51688022/article/details/134701765
今日推荐