大数据工具应用

第一部分

1、单选题:
2011年麦肯锡研究院提出的大数据定义是:大数据是指其大小超出了常规数据库工具获取、储存、管理和( )能力的数据集。
选项:
A:访问
B:分析
C:计算
D:应用

2、单选题:
用4V来概括大数据的特点的话,一般是指:Value、Velocity、Volume和( )。
选项:
A:Valley
B:Variety
C:Vainly
D:Vagary

3、单选题:
大数据分析四个方面的工作主要是:数据分类、( )、关联规则挖掘和时间序列预测。
选项:
A:数据统计
B:数据聚类
C:数据计算
D:数据清洗

4、判断题:
新浪和京东联合推出的大数据商品推荐,是由京东盲目推送到当前浏览新浪网站的用户的页面上的。
选项:
A:错
B:对

5、判断题:
目前的大数据处理技术只能处理结构化数据。
选项:
A:对
B:错

第二部分

1、单选题:
我们常用的微软Office套件中的Access数据库软件的数据库文件格式后缀名是( )。
选项:
A:dbf
B:mdf
C:mdb
D:xls

2、单选题:
大多数日志文件的后缀名是( )。
选项:
A:log
B:xml
C:txt
D:csv

3、单选题:
本课程重点介绍的weka软件的专有文件格式是( )。
选项:
A:ARFF
B:MongoDB
C:key map
D:value

4、单选题:
数据清洗工作的目的主要是要解决数据的完整性、唯一性、合法性和( )。
选项:
A:排他性
B:专业性
C:共享性
D:一致性

5、单选题:
八爪鱼软件的“自定义采集”工作方式下,需要在软件里输入一个( )来作为采集的目标。
选项:
A:用户名
B:关键词
C:电话号码
D:网页地址

6、单选题:
八爪鱼软件的采集规则可以通过文件的形式来导入或者导出,这种文件的后缀名是( )。
选项:
A:jpg
B:otd
C:png
D:gif

7、判断题:
Excel可以通过“数据有效性”按钮操作来规范数据输入的范围。
选项:
A:错
B:对

8、判断题:
Excel不能导入txt或csv格式的文件。
选项:
A:错
B:对

9、判断题:
八爪鱼软件只能对软件内建了“简易采集”规则的网站采集数据。
选项:
A:错
B:对

10、判断题:
八爪鱼软件进行自定义采集时,需要了解对网页的页面结构。
选项:
A:错
B:对

发布了98 篇原创文章 · 获赞 100 · 访问量 2076

猜你喜欢

转载自blog.csdn.net/qq_43133192/article/details/105165646