云计算与大数据第7章 大数据概览练习题及答案

7章 大数据概览习题

7.1 选择题

1、下列说法错误的是(  B  )。

A. 数据是指对客观事件进行记录并可以鉴别的符号    

B. 信息是数据的表现形式和载体

C. 数据只有在传递的过程中才能够被称为信息

D. 信息的时效性对于信息的使用和传递具有重要的意义

2、从数据的表现形式看,大数据的主要典型特征有(  A  )。

              ①海量   ②多样  ③快速  ④价值

A. ①②③④     B. ②③④       C. ①③④        D. ①②④

3、 以下(  B  )不是大数据生命周期的主要组成部分。

A. 数据采集       B. 数据压缩       C. 数据处理         D. 结果可视化

4、目前大数据平台主要包括大数据采集平台、大数据批处理平台、流数据处理平台、内存计算平台和深度学习平台等;以下(  C  )属于流数据处理平台。

A. Hadoop                    B. Pytorch             C. Storm             D. TensorFlow

5、Nutch是采用( D )语言编写的具有高可扩展性的搜索引擎。

A. Pytorch             B. C                  C. BASIC          D. Java

7.2 填空题

1、数据(   可视化   )指通过图形化的方式,以一种直观、便于理解的形式展示数据及分析结果的方法。

2、(   深度学习   )通过建立进行分析学习的多层次深度神经网络,组合低层特征形成更加抽象的高层表示属性类别或特征,以发现数据的分布式特征表示。

3、Storm平台中,( Topology/拓扑 )是由一系列通过数据流相互关联的Spout和Bolt组成的有向无环图。

4、TensorFlow是由( 张量/Tensor )和(  数据流/Flow  )两部分组成。

5、Spark作业执行一般采用(  主从式  )架构。

7.3 简答题

1、请简单描述Nutch与Hadoop之间的关系。

答:

Nutch为实现基于Hadoop分布式平台下的多物理主机并行进行数据采集提供了有效支持。在Hadoop分布式平台下,Nutch采用Hadoop分布式文件系统,通过Hadoop的MapReduce计算模型来采集页面中与某个主题相关的数据,可在短时间内采集大量的数据。Nutch与Hadoop的关系如下图所示。

2、分析相关数据可以帮助企业降低成本、提高效率、开发新产品、做出更明智的业务决策等。通过大数据分析,企业一般可以实现哪些目标?

答:

(1)及时解析故障、问题和缺陷的根源,从而降低成本。

(2)为成千上万的快递车辆规划实时交通路线,避开拥堵。

(3)分析库存,以利润最大化为目标来定价和清理库存。

(4)根据客户的购买习惯,推送客户可能感兴趣的优惠信息。

(5)从大量客户中快速识别出金牌客户。

(6)通过流量分析和数据挖掘来规避欺诈行为。

3、为了保证内容的正确性,维基百科在技术上和运行规则上制订了哪些规范?

答:

(1)版本控制。保留词条每一次更新的版本,即使参与者将整个词条删掉,管理者也可以很方便地从记录中恢复词条。

(2)词条锁定。采用锁定技术将一些主要词条的内容锁定,其他人就不可再编撰这些词条。

(3)更新备注。在更新一个词条时可以在描述栏中备注,以便管理员知道词条更新的操作细节。

(4)IP禁用。为了防止恶意用户对系统及内容的破坏,维基百科通过识别和禁用IP的方式,防止恶意用户的后续破坏行为。

(5)沙盒测试。维基百科的词条都建有沙盒测试页面,以便让初次参与的人先到沙盒页面来无损害的熟悉系统功能,即使操作失误也没有关系。

7.4 解答题

1、制造业需要利用数据分析技术、工具或平台,智能地从大量复杂的原始生产数据中发现新的模式和知识作为改进生产过程的决策依据。面向制造业的数据处理平台架构包含哪几个层次?

答:

  1. 物理资源层。物理资源层主要包括底层的物理设备,这些物理设备能有效地支撑数据存储和扩展。
  2. 逻辑资源层。逻辑资源层包括存储资源和计算资源。存储资源建立在物理设备的基础上,包括传统数据库、本地文件系统、分布式文件系统等。计算资源是逻辑上的计算单元,数据处理平台的计算能力依赖于计算单元的数量,通过扩展配置计算单元的数量能有效地支撑上层的数据挖掘任务。
  3. 数据分析任务管理层。该层是数据处理平台的核心,能有效地连接分析功能与后台集群。合理的数据分析平台设计需要具备任务管理能力主要包括易于算法扩展、支持任务流和任务间依赖关系的配置、任务调度、计算资源和存储资源的配置。数据分析平台通过数据分析框架来有效支撑数据分析任务管理。
  4. 数据分析层。数据分析层提供具体分析任务的用户执行接口,数据分析任务主要包括数据立方、对比分析、时间维分析、数据操作、结果展示和分析报告。

猜你喜欢

转载自blog.csdn.net/m0_63394128/article/details/126567994