计算机科学采用训练数据集,验证数据集,测试数据集 的方法 为什么不采用统计学中常用的假设检验呢? (参数检验 和 非参数检验)

如题所说, 这个问题作为一个本科读管理,硕士读计算机却旁修经济学,博士在读计算机的我来说感觉比较迷惑的。在管理学,经济学,计算机这三门学科在解决优化问题的时候采用的方法大致相同,其核心都是统计学,管理学,计算机科学中采用的基础方法,如线性回归,多元线性回归,广义线性回归,决策树,SVM,ID3,KNN等分类方法,同时也包括遗传算法,模糊数学,粒子群算法等, 这时候我们会发现这样一个情况就是  以经济学为代表对数据进行回归预测是一定要采取假设检验来看最终的P值,判断模型是否成立,这一步是必须的操作,对于数据的平稳性的验证等,但是在计算机学科中却极少见到这样的操作,我在读硕士期间曾做过智能算法方向的学习,在这里有见过比较少的部分采用了假设检验,但是这就出现了一个比较神奇的问题,那就是不同学科采用同样方法来解决问题时问什么经济学等学科就要采用假设检验,而计算机学科却极少的采用建设检验呢?

===============================================================

以下线内内容引自:

https://www.cnblogs.com/sanshuiyijing/p/3447315.html

百度百科的定义:

非参数检验(Nonparametric tests)是统计分析方法的重要组成部分,它与参数检验共同构成统计推断的基本内容。参数检验是在总体分布形式已知的情况下,对总体分布的参数如均值、方差等进行推断的方法。但是,在数据分析过程中,由于种种原因,人们往往无法对总体分布形态作简单假定,此时参数检验的方法就不再适用了。非参数检验正是一类基于这种考虑,在总体方差未知或知道甚少的情况下,利用样本数据对总体分布形态等进行推断的方法。由于非参数检验方法在推断过程中不涉及有关总体分布的参数,因而得名为“非参数”检验。

单样本:

SPSS单样本非参数检验是对单个总体的分布形态等进行推断的方法,其中包括卡方检验、二项分布检验、K-S检验以及变量值随机性检验等方法。

独立样本:

两独立样本的非参数检验

两独立样本的非参数检验是在对总体分布不甚了解的情况下,通过对两组独立样本的分析来推断样本来自的两个总体的分布等是否存在显著差异的方法。独立样本是指在一个总体中随机抽样对在另一个总体中随机抽样没有影响的情况下所获得的样本。
SPSS中提供了多种两独立样本的非参数检验方法,其中包括曼-惠特尼U检验、K-S检验、W-W游程检验、极端反应检验等。
多独立样本的非参数检验。
两独立样本的非参数检验是在对总体分布不甚了解的情况下,通过对两组独立样本的分析来推断样本来自的两个总体的分布等是否存在显著差异的方法。独立样本是指在一个总体中随机抽样对在另一个总体中随机抽样没有影响的情况下所获得的样本。
SPSS中提供了多种两独立样本的非参数检验方法,其中包括曼-惠特尼U检验、K-S检验、W-W游程检验、极端反应检验等。

相关样本:

两配对样本的非参数检验
两配对样本的非参数检验是对总体分布不甚了解的情况下,通过对两组配对样本的分析,推断样本来自的两个总体的分布是否存在显著差异的方法。
SPSS提供的两配对样本非参数检验的方法主要包括McNemar检验、符号检验、Wilcoxon符号秩检验等。
多配对样本的非参数检验
多配对样本的非参数检验是通过分析多组配对样本数据,推断样本来自的多个总体的中位数或分布是否存在显著差异。
例如,收集乘客对多家航空公司是否满意的数据,分析航空公司的服务水平是否存在显著差异;再例如,收集不同促销形式下若干种商品的销售额数据,分析比较不同促销形式的效果,再如,收集多名评委对同一批歌手比赛打分的数据,分析评委的打分标准是否一致,等等。
这些问题都可以通过多配对样本非参数检验方法进行分析。SPSS中的多配对样本的非参数检验方法主要包括Friedman检验、Cochran Q检验、Kendall协同系数检验等。

=================================================================

猜你喜欢

转载自www.cnblogs.com/devilmaycry812839668/p/10133826.html