重测信度及常见评价方法

定义：

重测信度（test-retest reliability），又称再测信度、稳定性系数（coefficient of stability），反映测验跨越时间的稳定性和一致性，即应用同一测验方法，对同一组被试者先后两次进行测查，然后计算两次测查所得分数的关系系数。该信度能表示两次测试结果有无变动，反映了测验分数的稳定程度。相关程度高，表示前后测量一致性高，稳定性好。重测的过程考虑了不同的条件（环境的、人的）带来的测量结果的误差，这种误差与两次施测的情境相关联。

简而言之，把同一被试者、同一个测验在不同的时间测量两次所得结果的相关系数称为重测信度。 重测信度侧重评估时间差异所造成的误差及其对测验稳定性的影响，评价重测信度时应注意重测间隔时间长短对重测相关系数的影响。

计算结果的代表含义

①如果相关值为1，则该测验具有完美无瑕的信度，表明被试在两次测验上得到了完全一致的分数，但这种情况在心理学和教育学的研究中基本不会出现。②如果两次测验的相关系数为0，则该测验完全不可靠，表明被试在第二次测验时得到了与第一次完全不一致的分数。在此种情况下，这些分数毫无意义。③如果两次测验之间的相关值为负值，则表明被试在第一次测验中取得的分数越高，在第二次测验中所取得的分数越低；反之亦然。即便出现这种意外情况，测验的信度也同样被认定为0。

时间间隔的影响

重测的过程考虑了不同的条件（环境的，人的）带来的测量结果的误差，这种误差与两次施测的情境相关联。因为在前后两种情境中施测的是同一个测验，所以重测系数不能反映测验题目样本不同所带来的误差。此外，两次施测的条件也和时间间隔有关，时间间隔越长，误差变异越大。因此，当第一次施测和第二次施测的时间间隔相对较短时（几天或几周），重测的稳定性系数会较大；反之，当第一次施测和第二次施测的时间间隔较长时（几个月或几年），该系数就会偏小。

优劣势

优点
用再测法估计信度能提供有关测验结果是否随时间而改变的资料，可作为预测受测者将来行为表现的依据。
局限
再测信度易受练习和记忆的影响，前后两次施测间隔的长短务必适宜。如果相隔时间太短，则记忆犹新，练习的影响较大；如果相隔时间太长，则身心的发展与学习经验的累积等均足以改变测验分数而使相关降低。
另外，第一次测试所发现的错误也可能导致第二次反应的变化而增加误差变异。
同时，再测信度只适用于测量那些不会随时间的变化而改变的特质。

重测信度评价方法

Bland-Altman分析：Bland 和 Altman (1986) 首次提出了 Bland-Altman 分析方法。它的基本思路是计算出两种测量结果的一致性界限，并用图形直观地反映一致性界限和两种方法测量差距的分布情况，最后结合临床实际经验，分析两种测量方法是否具有一致性。
组内相关系数(ICC)：衡量和评价观察者间信度(inter-observer reliability)和复测信度(test-retest reliability)的信度系数(reliability coefficient)指标之一。它最先由Bartko于1966年用于测量和评价信度的大小。ICC等于个体的变异度除以总的变异度，故其值介于0～1之间。0表示不可信，1表示完全可信。一般认为信度系数低于0.4表示信度较差，大于0.75表示信度良好，对于定量资料常常需要更高的ICC值。
标准测量误差(SEm)：是2014年公布的心理学名词，同一测验在同一被试上重复施测所得分数服从正态分布，其分布标准差的估计值

定义：

计算结果的代表含义

时间间隔的影响

优劣势

重测信度评价方法

おすすめ