El lenguaje R dibuja la curva de supervivencia de Kaplan-Meier

A menudo usamos curvas de supervivencia para expresar la tasa de supervivencia acumulada o la morbilidad de los pacientes en la práctica clínica. Como se muestra en la figura siguiente, la curva de supervivencia de Kaplan-Meier puede indicar la morbilidad, la supervivencia y otros datos clave de los pacientes en diferentes momentos. claro de un vistazo.
Inserte la descripción de la imagen aquí
Inserte la descripción de la imagen aquí
Hoy demostraremos cómo hacer dos imágenes como la anterior.Las imágenes coloridas son de nuestro último artículo de la base de datos SEER, titulado: Incidencia, factores pronósticos y resultado de supervivencia en pacientes con linfoma hepático primario. Todavía usamos nuestros datos anteriores sobre el cáncer de mama. No quería usar estos datos, pero no encontré buenos datos. Los amigos que lo necesiten presten atención a la respuesta oficial de la cuenta: cáncer de mama, puede obtener los datos.
Se requieren dos paquetes de survival y survminer, que deben descargarse con anticipación.
Primero importamos el paquete y los datos del cáncer de mama

library(survival)
library("survminer")
library(foreign)
bc <- read.spss("E:/r/test/Breast cancer survival agec.sav",
                use.value.labels=F, to.data.frame=T)
bc <- na.omit(bc)
names(bc)

Inserte la descripción de la imagen aquí
Primero veamos los datos:
edad significa edad, pathize significa tamaño patológico del tumor (cm), lnpos significa ganglios linfáticos axilares positivos, histgrad significa grado histopatológico, er significa estado del receptor de estrógeno, pr significa estado del receptor de progesterona, estado Si el resultado evento es la muerte o no, Pathscat representa la categoría de tamaño del tumor patológico (variable de agrupación), ln_yesno representa si hay agrandamiento de los ganglios linfáticos, el tiempo es el tiempo de supervivencia y el siguiente agec lo establecemos nosotros mismos, no importa.
Esta vez queremos comparar si hay agrandamiento de los ganglios linfáticos (ln_yesno) en el resultado de supervivencia del cáncer de mama.
Primero, ajustamos y analizamos las ecuaciones para obtener el número de eventos, el tiempo de supervivencia y otros datos para cada grupo de pacientes.

fit <- survfit(Surv(time,status) ~ln_yesno, 
               data = bc) # 拟合方程
summary(fit)

Inserte la descripción de la imagen aquí
Utilice ggsurvplot para trazar

ggsurvplot(fit, data = bc)

Inserte la descripción de la imagen aquí
También puede agregar intervalos de confianza y tablas de ocurrencia de riesgos

ggsurvplot(fit, data = bc,
           conf.int = TRUE, 
           risk.table = TRUE) # 添加风险表

Inserte la descripción de la imagen aquí
También puede agregar el tiempo total de supervivencia del paciente y el valor P

在这里插入代码片
```ggsurvplot(fit, # 创建的拟合对象
           data = bc,  
           conf.int = TRUE, # 显示置信区间
           pval = TRUE, # 添加P值
           add.all = TRUE) # 添加总患者生存曲线

![在这里插入图片描述](https://img-blog.csdnimg.cn/20210226103523522.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L2RlZ2U4NTc=,size_16,color_FFFFFF,t_70)
还可以进一步美化

```r
ggsurvplot(fit, # 创建的拟合对象
           data = bc,  # 指定变量数据来源
           conf.int = TRUE, # 显示置信区间
           pval = "log-rank test p: 0.031", # 添加P值
           surv.median.line = "hv",  # 添加中位生存时间线
           risk.table = TRUE, # 添加风险表
           risk.table.col = "strata", # 根据分层更改风险表颜色
           xlab = "Follow up time(d)", # 指定x轴标签
           legend = c(0.7,0.2), # 指定图例位置
           legend.title = "Kaplan-Meier", # 设置图例标题
           legend.labs = c("pr=1", "pr=0"), # 指定图例分组标签
           break.x.by = 10,# 设置x轴刻度间距
           break.y.by = 0.1,# 设置y轴刻度间距
           palette = c("#E7B800", "#2E9FDF"),##更改线条颜色
           ggtheme = theme_bw()) #添加网格线

Inserte la descripción de la imagen aquí
A continuación, haga el gráfico de la función de tasa de eventos (muerte)

ggsurvplot(fit, data = bc, 
           conf.int = TRUE, # 增加置信区间
           fun = "cumhaz") # 绘制累计风险曲线

Inserte la descripción de la imagen aquí
Puede embellecerse aún más

ggsurvplot(fit, data = bc, 
           conf.int = TRUE, # 增加置信区间
           fun = "cumhaz",# 绘制累计风险曲线
           pval = "log-rank test p:0.0025", # 添加P值
           risk.table = TRUE, # 添加风险表
           risk.table.col = "strata", # 根据分层更改风险表颜色
           xlab = "Follow up time(d)", # 指定x轴标签
           legend = c(0.2,0.8), # 指定图例位置
           legend.title = "Kaplan-Meier", # 设置图例标题
           legend.labs = c("pr=1", "pr=0"), # 指定图例分组标签
           break.x.by = 10,# 设置x轴刻度间距
           break.y.by = 0.05,# 设置y轴刻度间距
           palette = c("#E7B800", "#2E9FDF"),##更改线条颜色
           ggtheme = theme_bw()) #添加网格线

Inserte la descripción de la imagen aquí
Para obtener más artículos interesantes, preste atención al número público: Zero-Basic Research. Si desea obtener los datos del cáncer de mama en este artículo, siga la cuenta oficial y responda: cáncer de mama, puede obtener los datos
Inserte la descripción de la imagen aquí

Supongo que te gusta

Origin blog.csdn.net/dege857/article/details/114116628
Recomendado
Clasificación