机器学习专项练习

题目来自牛客网的专项练习,解答部分参考了网友们的评论。

这是一篇查漏补缺的帖子,所以只放了一些我不熟悉的知识点,或者是做错的题目。

贝叶斯

假定某同学使用Naive Bayesian(NB)分类模型时,不小心将训练数据的两个维度搞重复了,那么关于NB的说法中正确的是:

A. 这个被重复的特征在模型中的决定作用会被加强

B. 模型效果相比无重复特征的情况下精确度会降低

C. 如果所有特征都被重复一遍,得到的模型预测结果相对于不重复的情况下的模型预测结果一样。

D. 当两列特征高度相关时,无法用两列特征相同时所得到的结论来分析问题

E. NB可以用来做最小二乘回归

F. 以上说法都不正确

正确答案是BD。

NB的核心在于它假设向量的所有分量之间是独立的。

扫描二维码关注公众号,回复: 2618321 查看本文章

在贝叶斯理论系统中,都有一个重要的条件独立性假设:假设所有特征之间相互独立,这样才能将联合概率拆分。

重复的数据维度会破坏独立性。

CNN

输出的大小

输入图片大小为200×200,依次经过一层卷积(kernel size 5×5,padding 1,stride 2),pooling(kernel size 3×3,padding 0,stride 1),又一层卷积(kernel size 3×3,padding 1,stride 1)之后,输出特征图大小为:

答案为97。

输出尺寸=(输入尺寸-filter尺寸+2*padding)/stride+1

计算尺寸不被整除只在GoogLeNet中遇到过。卷积向下取整,池化向上取整。

本题:(200-5+2*1)/2+1 为99.5,取99

           (99-3)/1+1 为97

           (97-3+2*1)/1+1 为97

研究过网络的话看到stride为1的时候,当kernel为 3 padding为1或者kernel为5 padding为2 一看就是卷积前后尺寸不变。

猜你喜欢

转载自blog.csdn.net/m0_37622530/article/details/81428833