R言語はカプランマイヤー生存曲線を描く

臨床診療における患者の累積生存率または罹患率を表すために生存曲線を使用することがよくあります。下の図に示すように、カプランマイヤー生存曲線は、さまざまな時点での患者の罹患率、生存率、およびその他の重要なデータをよく示しています。一目でわかります。
ここに画像の説明を挿入
ここに画像の説明を挿入
今日は、上記のような2つの写真を作成する方法を示します。カラフルな写真は、前回のSEERデータベースの記事「原発性肝リンパ腫患者の発生率、予後因子、および生存転帰」からのものです。以前の乳がんデータを引き続き使用しています。このデータは使用したくありませんでしたが、適切なデータは見つかりませんでした。困っている友達は公式アカウントの返信に注意を払ってください:乳がん、あなたはデータを得ることができます。
Survivalとsurvminerの2つのパッケージが必要であり、事前にダウンロードする必要があります。
まず、パッケージと乳がんのデータをインポートします

library(survival)
library("survminer")
library(foreign)
bc <- read.spss("E:/r/test/Breast cancer survival agec.sav",
                use.value.labels=F, to.data.frame=T)
bc <- na.omit(bc)
names(bc)

ここに画像の説明を挿入
最初にデータを見てみましょう:
年齢は年齢を意味し、pathsizeは病理学的腫瘍サイズ(cm)を意味し、lnposは陽性の腋窩リンパ節を意味し、histgradは組織病理学的グレードを意味し、erはエストロゲン受容体の状態を意味し、prはプロゲステロン受容体の状態を意味します。イベントは死亡かどうか、pathscatは病理学的腫瘍サイズカテゴリ(グループ化変数)を表し、ln_yesnoはリンパ節腫大があるかどうかを表し、時間は生存時間であり、次の年齢は自分で設定します。気にしないでください。
今回は、乳がんの生存転帰にリンパ節腫大(ln_yesno)があるかどうかを比較したいと思います。
まず、方程式を当てはめて分析し、患者の各グループのイベント数、生存時間、その他のデータを取得します。

fit <- survfit(Surv(time,status) ~ln_yesno, 
               data = bc) # 拟合方程
summary(fit)

ここに画像の説明を挿入
ggsurvplotを使用してプロット

ggsurvplot(fit, data = bc)

ここに画像の説明を挿入
信頼区間とリスク発生表を追加することもできます

ggsurvplot(fit, data = bc,
           conf.int = TRUE, 
           risk.table = TRUE) # 添加风险表

ここに画像の説明を挿入
患者の総生存時間とP値を追加することもできます

在这里插入代码片
```ggsurvplot(fit, # 创建的拟合对象
           data = bc,  
           conf.int = TRUE, # 显示置信区间
           pval = TRUE, # 添加P值
           add.all = TRUE) # 添加总患者生存曲线

![在这里插入图片描述](https://img-blog.csdnimg.cn/20210226103523522.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L2RlZ2U4NTc=,size_16,color_FFFFFF,t_70)
还可以进一步美化

```r
ggsurvplot(fit, # 创建的拟合对象
           data = bc,  # 指定变量数据来源
           conf.int = TRUE, # 显示置信区间
           pval = "log-rank test p: 0.031", # 添加P值
           surv.median.line = "hv",  # 添加中位生存时间线
           risk.table = TRUE, # 添加风险表
           risk.table.col = "strata", # 根据分层更改风险表颜色
           xlab = "Follow up time(d)", # 指定x轴标签
           legend = c(0.7,0.2), # 指定图例位置
           legend.title = "Kaplan-Meier", # 设置图例标题
           legend.labs = c("pr=1", "pr=0"), # 指定图例分组标签
           break.x.by = 10,# 设置x轴刻度间距
           break.y.by = 0.1,# 设置y轴刻度间距
           palette = c("#E7B800", "#2E9FDF"),##更改线条颜色
           ggtheme = theme_bw()) #添加网格线

ここに画像の説明を挿入
次に、イベント(死亡)率関数グラフを作成します

ggsurvplot(fit, data = bc, 
           conf.int = TRUE, # 增加置信区间
           fun = "cumhaz") # 绘制累计风险曲线

ここに画像の説明を挿入
さらに美化することができます

ggsurvplot(fit, data = bc, 
           conf.int = TRUE, # 增加置信区间
           fun = "cumhaz",# 绘制累计风险曲线
           pval = "log-rank test p:0.0025", # 添加P值
           risk.table = TRUE, # 添加风险表
           risk.table.col = "strata", # 根据分层更改风险表颜色
           xlab = "Follow up time(d)", # 指定x轴标签
           legend = c(0.2,0.8), # 指定图例位置
           legend.title = "Kaplan-Meier", # 设置图例标题
           legend.labs = c("pr=1", "pr=0"), # 指定图例分组标签
           break.x.by = 10,# 设置x轴刻度间距
           break.y.by = 0.05,# 设置y轴刻度间距
           palette = c("#E7B800", "#2E9FDF"),##更改线条颜色
           ggtheme = theme_bw()) #添加网格线

ここに画像の説明を挿入
よりエキサイティングな記事については、公開番号「ゼロ基礎研究」に注意してください。この記事で乳がんのデータを取得したい場合は、公式アカウントに従って返信してください:乳がん、データを取得できます
ここに画像の説明を挿入

おすすめ

転載: blog.csdn.net/dege857/article/details/114116628