深度学习用于医学预后-第二课第三周4-7节-关于事件的时间数据,认识处理删失数据

在本课中,我们将讨论生存数据。为了能够对生存进行建模,我们需要能够以我们可以处理的形式表示数据。

主要的挑战是删失数据,这是一种特殊形式的缺失数据。我们接下来将要研究这一点。

在这节课中,我们将谈论生存数据和删失。

之前当我们研究预后模型时,我们会问一个问题,过去五年的生存概率是多少?我们有如下格式的数据

我们有一群患者,之前我们使用1表示该患者有事件,0表示该患者可能在五年内没有事件。这就是我们使用的数据。

请注意,这里的关键是我们需要的答案/结果基本上是肯定的或否定的(1或者0)

但现在,当我们处理生存数据时,我们想回答一个不同的问题。“不仅过去五年,过去任何时间t的生存概率是多少?” 为了能够做到这一点,所以我们需要一个信息。让我们通过一个例子来看看我们如何在为患者提供信息时获得这些信息。

当中风未被发现时

例如,我们将观察接受治疗的患者,并监测他们是否发生中风事件。如果他们中风了,看看从治疗到中风之间经过了多长时间。


假设,我们的第一位患者于2018年9月接受了治疗,他们在2019年9月一年后中风。所以对于这个病人,假设我们追踪了月数。这相当于从治疗到发生中风事件的12个月。因此,我们将在这个表中输入已经过去的月数,即12个月。

让我们看看另一个病人。

因此,对于这名患者,于2018年8月接受了治疗,我们对他进行了一年多的跟踪,直到2019年10月,我们决定结束研究。在这段时间内,我们没有观察到任何中风事件。我们知道患者在14个月内没有发生任何事件。

如果他们发生了事件(中风),那应该是在14个月后。所以我们写了一个14+。

第三个例子,患者在2018年8月接受了治疗,仅仅三个月后的2018年11月,他们决定退出研究。这种情况非常常见,原因有很多。比方说,这位患者不得不更换国家,因此不得不退出研究。

所以我们知道,在2018年8月至2018年11月期间,他们没有中风,但我们不知道之后发生了什么。所以我们要说这个病人的时间是3个多月。所以我们把它输入到表格中。

现在,第二种和第三种情况就是我们所说的删失(或审查,censoring)。是生存数据的重要组成部分,需要加以考虑。

心脏病发作数据

让我们把这些知识应用到一个例子中。在这个例子中,我们将观察接受手术的患者,并观察他们在手术后是否心脏病发作。

我们有三名患者,我们于2015年1月开始研究,并于2019年7月结束研究。因此,患者在不同的时间来做手术,我们追踪了他们心脏病发作的时间。

因此,对于第一位患者,他们在2016年3月进行了手术,并在2017年3月心脏病发作,因此我们可以将其记下来,患者1的时间为12个月。

患者2在2015年7月进行了手术,直到2019年7月,我们没有观察到任何心脏病发作事件。所以这是一个四年的过程,相当于48个月。现在请注意,我们已经48个月没有看到任何活动了,所以我们要在这里加一个加号。

对于第三位在2015年11月接受手术的患者,他们在2017年11月退出了手术,所以我们对他们进行了两年或24个月的观察,我们观察到在这段时间内没有发生任何事件,所以我们写24个月+。

因此,通过这种方式,我们可以用图片右边的形式来表示我们的生存数据。

总结一下,我们有生存数据,从将数据表示为“是”或“否”的转变,就像我们在二进制设置中所做的那样,到询问何时以及表示从起源到事件的时间,以及将这些经过审查的观测作为我们数据的一部分,我们将很快对此进行研究。

右删失


我们之前简单地提到过删失,当我们看到一个病人做了2018年8月手术,然后在2018年11月研究结束前退出了研究。我们由此得出的结论是病人在三个月内没有发病。

现在,有可能这个病人在2019年1月发生了事件(如中风的事件),但这可能是任何事件。

但也有可能病人根本就没有发生过这种事,只是一直很健康。

注意到事件总是发生在最后一次接触之后,如果它发生的话,这就是所谓的“右删失”(right censoring)。正式地说,是事件发生的时间超过一定的值。

例如上图,如果这里是2018年8月,这里是2018年11月,那么事件发生的时间将超过三个月,所以我们把这个数据点写成3+。

我们研究过两种类型的右删失:

  • 第一种,我们有一个病人因为我们的研究结束而缺失,这被称为研究结束删失;
  • 第二种,我们有一个病人在研究结束前退出,这被称为失访删失。

现在,删失在生存数据中是一个非常重要的概念,它对于理解生存模型是非常必要的,我们很快就会看到。

下一章,我们将学习使用删失数据进行生存评估~

文章持续更新,可以关注微信公众号【医学图像人工智能实战营】获取最新动态,一个关注于医学图像处理领域前沿科技的公众号。坚持已实践为主,手把手带你做项目,打比赛,写论文。凡原创文章皆提供理论讲解,实验代码,实验数据。只有实践才能成长的更快,关注我们,一起学习进步~

我是Tina, 我们下篇博客见~

白天工作晚上写文,呕心沥血

觉得写的不错的话最后,求点赞,评论,收藏。或者一键三连
在这里插入图片描述

猜你喜欢

转载自blog.csdn.net/u014264373/article/details/130674966