版权声明:署名,允许他人基于本文进行创作,且必须基于与原先许可协议相同的许可协议分发本文 (Creative Commons)
混淆矩阵——灵敏性和特异性理解
定义
案例
假设一共有100,000名患者,其中患有恶性肿瘤的人数为200人,即患病率为0.2%,实际检测结果如下表:
测试阳性 | 测试阴性 | 总计 | |
---|---|---|---|
实际阳性 | 160 | 40 | 200 |
实际阴性 | 29940 | 69860 | 99800 |
总计 | 30100 | 69900 | 1000000 |
根据以上数据:
即:
灵敏度(又称召回率)表示实际检测出的患病人数占总患病人数的比例达到80%,即能检测出来的真实患者比例
特异性表示测试在不患病人群中,确定排除不患病的概率达到70%,将有30%的可能性会被测试为阳性,而实际上并不患病。即能检测出来真实不患病的比例。
更优的模型,可以使全体样本在四个象限内的分布比例更加优化,提升灵敏度和特异性,增加了正对角线上样本的占比,也就是改进了检测效果。