机器学习期末复习题及答案

资源下载链接https://download.csdn.net/download/qq_53891711/87591530

第一套

一.单项选择

  1. 机器学习把数据集分成训练集和(B)
    A.分析集 B.测试集 C.导入集 D.备用集
    2.以下属于解决模型欠拟合的方法是©
    A、增加训练数据量
    B、对模型进行裁剪
    C、增加训练过程的迭代次数
    D、正则化
    3.K近邻算法是(A)
    A.有监督学习
    B.无监督学习
    C.半监督学习
    D.自主学习
    4.素贝叶斯算法的判定公式(A)
    A.H(x)=argmax P(Ci)ΠP(ak|ci)
    B.H(x)=exp P© Π[P(ak|Ci)
    C.H(x)=minP© ΠP(ak|Ci)
    D.H(x)=logP© ΠP(ak|Ci)
    5.用Sklearn线性回归算法需要导入函数库(B)
    A.import numpv as np
    B.from sklearn. Linear_model import LinearRegression
    C.import matplotlib.pvplot as plt
    D.from math import sqrt
    6.聚类分析有几种算法©
    A.1 B.2 C.3 D.4
    7.支持向量机常用的核函数(A)
    A.高斯核函数
    B.二项式核函数
    C.贝叶斯核函数
    D.网络核函数
    8.回归模型性能评估平均绝对误差(C)
    A.RMSE
    B.MSE
    C.MAE
    D.R Square
    9.决策树生成有几种算法(C)
    A.1
    B.2
    C.3
    D.4
    10.神经元模型是(B)
    A.生物神经
    B.神经网络中最基本的组成部分
    C.计算机存储单元
    D.多层感知机
    二、多项选择题
    1.Python机器学习编程库有(BCD)
    A.VB
    B.Numpy
    C.Matplotlib
    D.Sklean
    2.数据清洗包括(BD)
    A.训练数据
    B.缺失值处理
    C.分类
    D.离群值检查
    3.决策树算法包括(ACD).
    A.ID3算法
    B.ID4算法
    C.C4.5算法
    D.CART算法
    4.回归模型有(ABD).
    A.简单线性回归
    B.多元线性回归
    C.最小算子回归
    D.弹性回归
    5.神经网络算法可完成的任务(ABCD)
    A.分类
    B.回归
    C.感知
    D.机器翻译
    三、名词解释
    1.欠拟合:在训练数据和预测结果时,模型精确度均不高的情况,未能把握核心特征
    2.性能评估:准确率,查准率,查全率,综合评价指标
    3.线性回归:线性回归的目的是针对一个或多个特征与连续目标变量之间的关系建模,主要 分为简单线性回归和多元线性回归
    4.分类:输入一个数据,训练模型推断出它的类别,通过已有数据集的学习,训练得到一个目标函数,把每个数据集的元素x映射到目标类别y,且y必须是离散的
    5.均方误差:是反映估计量与被估计量之间差异程度的一种度量
    四.简答题
    1.“决策树算法”的原理是什么?
    决策树是一个类似于流程图的树结构,分支节点表示对一个特征进行测试,根据测试结果进行分类,树叶节点代表一个类别
    2.“朴素贝叶斯算法”的原理是什么?
    利用概率统计进行分类,基于贝叶斯定理,对于一个待分类项,求解属于各个类别的概率,概率最大的类别即为待分类项的类别
    3.在SVM中,如何理解线性不可分?
    线性不可分简单来说就是你一个数据集不可以通过一个线性分类器(直线、平面)来实现分类。这样子的数据集在实际应用中是很常见的,我们不可以使用一个直线或者一个直面把上面图像中的两类数据很好的划分。这就是线性不可分
    五.编程题
    1.说明用简单线性回归算法进行数据回归的编程步骤,只写步骤,不用编程
    导入库函数
    导入数据集
    建模(模型实例化)
    模型拟合(模型训练)
    预测
    模型评价
    2.编程实现下面数据集的K近邻算法分类数据集:
    特征值=([3,2],[3,1],[1,3],[3,4],[2,2],[7,4],[5,3],[9,2],[7,3],[7,0])
    标签=([0,0.0,0,0,1.1.1.1,1])
    导入sklearn库函数:
    from sklearn.neighbors import KNeighborsClassifier
    导入数据集:
    X=[[3,2],[3,1].[1,3],[3,4],[2,2].[7,4],[5,3].[9,2],[7,3],[7,0]]
    y=[0,0,0,0,0,1,1,1,1,1]

第二套

一、单选

1.机器学习是一门(A)的科学。
A.人工智能
B.计算机
C.网格
D.统计学
2.机器学习性能评估是对(B)进行评估。
A.学习能力
B.查准率和查全率
C.学习方法
D.学习效率
3.PCA降维是(B)。
A.有监督学习
B.无监督学习
C.半监督学习
4.素贝叶斯算法的判定公式(A)。
A.H(x)=argmaxP(Ci)
B.H(x)=maxP(Ci)
C.H(x)=minP(Ci)
D.H(x)=logP(Ci)
5.用Sklearn K近邻算法需要导入函数库(B)。
A.import numpy as np
B.from sklearn neighbors import KNeighborsClassifier
C.import matpolotlib.pvplot as plt
D.from math import sqrt
6.决策树有几种算法©。
A.1
B.2
C.3
D.4
7.支持向量机常用的核函数有几种©。
A.1
B.2
C.3
D.4
8.回归模型性能评估均方差(A)。
A.RMSE
B.MSE
C.RMS
D.R Square
9.聚类分析有几种方法©。
A.1
B.2
C.3
D.4
10.人工神经网络是(分布式网络)。
二、多选
1.回归算法有(ACD)。
A.简单线性回归
B.多元线性回归
C.有限元回归
D.多项式回归
2.机器学习的任务有(分类、聚类)。
A.训练数据
B.无
3.决策树算法的划分标准(CD)
C.信息增益
D.基尼指数
4.正规化回归模型有(BCD)。
A.简单线性回归
B.岭回归
C.最小绝对收缩与选择算子
D.弹性网络
5.神经网络算法可完成(ABCD)的任务。
A.分类
B.回归
C.感知
D.机器翻译
三、名词解释
1.机器学习:研究怎样让计算机模拟并实现人类的学习行为,以获取新的知识或技能,他是人工技能的核心,是使计算机具有智能的根本途径
2.过拟合:指模型出现拟合过度的情况,特征值选取过多
3.数据清洗:主要是通过填补缺失值,光滑噪声数据,平滑或删除离群点并解决数据的不一性来“清理”数据
4.聚类:按照某个特定标准(如距离准则)把一个数据集分割成不同的类或簇,使得同一簇内的数据对象的相似性尽可能大,同时不在同一簇中的数据对象的差异性也尽可能大
5.分类准确度:是指分类正确的样本占总样本的比例,Accuracy=ncorrect/ntotal

四、简答题

1.为什么要把数据集分成训练集与测试集?
当拟合模型时完全依靠训练集数据完成拟合,尽管对训练集数据来说,该模型是比较精确的,但并不能保证当它应用在其他数据时,还保持着较高贴合度,所以需要用测试集来验证模型的精准度
2.简单线性回归?
简单线性回归的目的是针对单个特征(解释变量x)和连续响应值(目标变量y)之间的关系建模,其定义式为:y=ω0+ω1x
3.在SVM中,如何理解线性可分?
在一维空间中,也就是在一个坐标轴上,要分开两个可分点的集合,只需找到一个点即可,在二维空间中,要分开两个线形可分点的集合,需要找到一条分类直线,在三维空间中,要分开两个线形可分的点集合,需要找到一个分类面,在n维空间中,要分开两个线形可分的点集合,则需要找到一个超平面
五、编程题
1.无
2.编程实现下面数据集的简单线性回归
数据集:
特征=1,2,3,4,5
标签=3,4,6,8,9
导入sklearn库函数:
From sklearn.linearn_model import LinearRegression
导入数据集:
X=[1,2,3,4,5]
Y=[3,4,6,8,9]

猜你喜欢

转载自blog.csdn.net/qq_53891711/article/details/129651801