R语言:wilcox 无法精确计算带连结的p值

出现这个问题应该是很常见的,网上没有找到很清楚的解释。在《非参统计》书里看到:

数据中有相同的数字,成为结(tie),结中的秩为按照升幂排列后位置的平均值,如果结多了,零分布的大样本公式就不准了,因此要做修正。”

修正公式:


在这里插入图片描述
其中n为样本量,g为结数,在这里插入描述为结统计量
也就是wilcox检验是基于样本来自连续对称分布的总体,所以本不应该有相同的值,但是由于四舍五入,连续变量观测到的值都是离散的,因此会产生打结。修正就好了。
或者wilcox里加exact=FALSE,也不会有warning了

猜你喜欢

转载自blog.csdn.net/weixin_42733583/article/details/88775900