题目一:关于 ARMA 、 AR 、 MA 模型的功率谱,下列说法正确的是( )
A
MA模型是同一个全通滤波器产生的
B
MA模型在极点接近单位圆时,MA谱是一个深谷
C
AR模型在零点接近单位圆时,AR谱是一个尖峰
D
RMA谱既有尖峰又有深谷
解析:正确答案是:D,具体参考https://blog.csdn.net/d07qs2kxkh0kksxex/article/details/78477256
题目二:下列哪个不属于常用的文本分类的特征选择算法?
A
卡方检验值
B
互信息
C
信息增益
D
主成分分析
解析:
正确答案是:D,主成分分析是特征转换算法(特征抽取),而不是特征选择算法。参考1、参考2
题目三:在数据清理中,下面哪个不是处理缺失值的方法?
A
估算
B
整例删除
C
变量删除
D
成对删除
解析:
正确答案是:D,数据清理中,处理缺失值的方法有两种: 一、删除法: 1)删除观察样本 2)删除变量:当某个变量缺失值较多且对研究目标影响不大时,可以将整个变量整体删除 3)使用完整原始数据分析:当数据存在较多缺失而其原始数据完整时,可以使用原始数据替代现有数据进行分析 4)改变权重:当删除缺失数据会改变数据结构时,通过对完整数据按照不同的权重进行加权,可以降低删除缺失数据带来的偏差 二、查补法:均值插补、回归插补、抽样填补等
题目四:统计模式分类问题中,当先验概率未知时,可以使用()
A
最小最大损失准则
B
最小误判概率准则
C
最小损失准则
D
N-P判决
解析:
正确答案是:A,
A. 考虑p(wi)变化的条件下,是风险最小
B. 最小误判概率准则, 就是判断p(w1|x)和p(w2|x)哪个大,x为特征向量,w1和w2为两分类,根据贝叶斯公式,需要用到先验知识
C. 最小损失准则,在B的基础之上,还要求出p(w1|x)和p(w2|x)的期望损失,因为B需要先验概率,所以C也需要先验概率
D. N-P判决,即限定一类错误率条件下使另一类错误率为最小的两类别决策,即在一类错误率固定的条件下,求另一类错误率的极小值的问题,直接计算p(x|w1)和p(x|w2)的比值,不需要用到贝叶斯公式。
题目五:决策树的父节点和子节点的熵的大小关系是什么?
A
A. 决策树的父节点更大
B
B. 子节点的熵更大
C
C. 两者相等
D
D. 根据具体情况而定
解析:正确答案:D。 假设一个父节点有2正3负样本,进一步分裂情况1:两个叶节点(2正,3负);情况2:两个叶节点(1正1负,1正2负)。分别看下情况1和情况2,分裂前后确实都有信息增益,但是两种情况里不是每一个叶节点都比父节点的熵小。
题目六:逻辑回归与多元回归分析有哪些不同?
A
逻辑回归预测某事件发生的概率
B
逻辑回归有较高的拟合效果
C
逻辑回归回归系数的评估
D
以上全选
解析:答案:D 逻辑回归是用于分类问题,我们能计算出一个事件/样本的概率;一般来说,逻辑回归对测试数据有着较好的拟合效果;建立逻辑回归模型后,我们可以观察回归系数类标签(正类和负类)与独立变量的的关系。参考
To be continue......