云计算与大数据第10章 大数据应用习题带答案

10章 大数据应用习题

10.1 选择题

1、目前典型的脑电信号的分类方式不包括(  B  )。

A. 按频率分类   B. 按信号长度分类   C. 按Gibbs分类   D.按图形分类

2、以下的(  D  )不属于心电信号的波段。

A. P频段        B. QT间期          C. U频段        D. SG频段

3、盲源信号分离所使用技术一般不包括(  C  )。

A.ICA         B.FastICA          C.SVM           D.以上都是

4、轨迹大数据的主要特征不包括以下的(  A  )。

A. 非平稳性         B. 4V特征                C. 异频采样性         D. 本身质量偏低

5、轨迹数据预处理中,为了避免误差距离太大,需要进行以(  B  )操作。

A.停留点检测   B.轨迹滤噪        C.轨迹压缩        D.地图匹配

6、解决路径规划问题的算法中,(  C  )一般是求得问题的次优解或以一定的概率求其最优解。

A.滤波算法        B.回归算法         C.启发式算法        D.精确算法

7、自然语言处理中(  A  )用于判断一个词语序列是否构成一句话概率。

A.语言模型        B.词袋模型        C.词频-逆向文档频率 D.词嵌入

8、典型智能问答系统包括(  D  )。

A.基于结构化数据的智能问答系统

B.基于自由文本的智能问答系统

C.基于常见问题集的智能问答系统

D.以上全是

9、图像大数据处理系统中的(  D  )主要对图片中的目标进行定位,并输出具体类别。

A.目标跟踪      B.图像分割        C.视频处理          D.目标检测

10、基于深度学习的目标检测方法中的(  B  )检测低速度快,但检测精度低。

A.阶段分割法    B.单阶段方法      C.视频阶段处理      D.双阶段方法

11、短文本分类方法中的(  B  )不依赖于特定场景,适应性较好。

A.基于特征扩展的方法

B.基于深度学习的方法

C.朴素贝叶斯方法

D.小波包变换方法

12、轨迹大数据的挖掘主要包含四种不同类别,其中(  A  )依靠一种或多种因素的组合来进行轨迹大数据挖掘。

A.伴随模式               B.轨迹聚类               C.序列模式               D.周期模式

13、为了克服独热编码缺陷,(  C  )通常将词语转化成为一个分布式表示的定长连续稠密向量。

A.语言模型               B.结构化数据           C.词嵌入                 D.周期化数据

14、轨迹大数据中的(  C  )方法将轨迹点坐标映射到真实世界路网上,获得轨迹对应路网信息。

A.轨迹预测         B.轨迹分割        C.地图匹配          D.轨迹压缩

10.2 填空题

1、小波包变换的关键步骤包括(  信号分解   )和(  信号重构   )。

2、自然语言处理中的独热编码缺点是(   不能区分多义词语    )。

3、Word2vec模型根据(    输入/输出    )的不同,可分为CBOW模型与Skip-Gram模型。

10.3 简答题

1、请对比分析小波变换和小波包变换两种方法。

答:

小波变换是把时间序列分解成低频和高频信息。分解出的低频a中失去的信息由高频d捕获。在下一层分解中,又将a分解成低频a1和高频d1两部分,低频a1中失去的信息由高频d1捕获。依此类推,可以进行更深层的分解。

相对于小波变换,小波包变换不仅对低频部分进行分解,还可以对高频部分进行更细致的分解。

2、请列举路径规划常采用的几种典型启发式算法。

答:

蚁群算法:包含路径构建和信息素更新两步骤。

遗传算法:通过不断循环迭代来搜索组合问题的最优解,直到满足预设的终止条件才结束。

模拟退火算法:先生成随机解,然后对随机解扰动,通过比较扰动解与当前解的目标函数值来决定是否将扰动解定义为新解。

3、请对比分析基于深度学习的目标检测方法中两阶段目标检测算法和单阶段目标检测算法。

答:

双阶段目标检测算法先对图像提取候选框,然后基于候选区域做二次修正得到检测点结果,检测精度较高,但检测速度较慢。

单阶段目标验测算法直接对图像进行计算生成检测结果,检测低速度快,但检测精度低。

4、问题分类流程中,文本预处理一般主要完成哪些工作?

答:

  1. 将英文缩写替换,将意思等价的缩写统一成为完整格式。
  2. 使用正则化方式去除文本中无用的各类符号,按照空格进行分词,使用拼写检查工具处理文本,减少拼写错误导致的噪声。
  3. 删除对分类没什么影响的停用词,如‘a’,‘is’等。
  4. 在深度学习模块,需要使用词嵌入对文本进行初始化

10.4 解答题

1、出租车是城市交通的重要组成部分。请回答以下问题:

  1. 请描述出租车寻找最佳客源的路径规划流程,并简单介绍每个步骤。
  2. 画出求解最优路径时所用到的模拟退火算法流程图。

答:

       1)出租车寻找最佳客源的路径规划流程:数据清洗→上/下客点提取→数据时空分析→热门区域挖掘→最佳客源挖掘→最优路径规划。

       数据清洗:剔除噪声数据,缺失数值和错误数值。

       上/下客点提取:出租车的载客状态从1变到0,是一个下客点;出租车的载客状态从0变到1,是一个上客点。

数据时空分析:研究一周内包括早高峰、晚高峰、工作日、非工作日等不同时段上/下客点的数据变化,及每个时间段的数据的空间分布。

热门区域挖掘:对于每个时段的每个区域应用DBSCAN算法,挖掘轨迹大数据中的热门区域。

最佳客源挖掘:采用K-Means等算法,对最佳客源点进行挖掘。

2)求解最优路径时所用到的模拟退火算法流程图如下:

2、基于视频的目标检测模块对于自动驾驶系统至关重要。请回答以下问题:

  1. 请画出面向自动驾驶的目标检测流程图。
  2. 说明在面向自动驾驶的目标检测系统中的主要组成模块。

面向自动驾驶的目标检测系统的流程:

2)面向自动驾驶的目标检测系统中的组成模块:

视频流解析模块:先获取计算机内置摄像头所摄的视频流,或者获取计算机本地视频,再解析接收到的视频流或者视频,此时还需要按照具体需求设置解析帧率,即每隔多长一段时间截取一帧图像,输出一连串单帧图像,从而完成输入图像的采集。

图像预处理模块:将图像缩放为统一的尺寸,匹配特征提取网络的设计结构。将这些统一尺寸的图像归一化处理(将RGB三通道的值(0~255)压缩为0~1),使得梯度在各个特征方向上的机会均等。

目标检测模块:实现系统提出的全部要求,主要包括训练部分和预测部分。训练部分需要准备和预处理训练数据集、添加各种数据增广策略、训练算法并优化其性能。预测部分连接图像预处理模块,首先进行网络初始化,然后通过网络提取图像预处理模块输出的待检测图像的特征,完成对图像中感兴趣目标的分类和定位,将这些信息在该帧图像上标注出来,并在可视化界面中显示出来。

猜你喜欢

转载自blog.csdn.net/m0_63394128/article/details/126568040