[文献解读]8分的肿瘤大数据挖掘是怎样炼成的?

作者:白介素2


[文献解读]8分的肿瘤大数据挖掘是怎样炼成的?摘要文章内容ER单阳性乳腺癌预后不良基因与表观遗传改变导致的PR丢失IHC找出ER单阳性组中的非luminal亚型总结

15721061-1c22bb2243590bc7.jpg
image

摘要

2018年12月发表了上海复旦肿瘤医院的基于TCGA,METABRIC,SEER等数据库的分析论文,发表在Theranostics杂志上,影响因子IF=8.5。ER单阳性乳腺癌约占乳腺癌病人总数的10%,全文总共使用了5个数据集,分别包括SEERMETABRIC,TCGA, MD Anderson以及作者自己的数据集作为验证。临床问题:ER单阳性乳腺癌对内分泌治疗抵抗,在基因组水平上PR基因拷贝数丢失与启动子甲基化解释了PR的丢失。有近20%的ER单阳性乳腺癌表现为非Luminal型,并且对内分泌治疗不敏感,作者找到了这个亚型的3个biomarker。作者得出结论,ER单阳性组乳腺癌还存在亚型与不良预后相关,应该使用不同的治疗策略。

文章内容

ER单阳性乳腺癌预后不良

  • 首先是给出了SEERMETABRIC数据集的临床病理特征,作者对此做了一些描述。
15721061-1e40eacfc5b91ddc.png
image.png
  • 其次比较了单阳性乳腺癌与ER/PR阳性乳腺癌及TNBC的生存率,为了说明ER单阳性乳腺癌的预后更差, 值得一提的是,作者使用了OSBCSS两个生存时间,Breast Cancer-Specific Survival指的是从诊断到死亡的时间。生存分析结果如下,很明显单阳性预后差得多:

    15721061-5b4c84af51dc0e28.png
    image.png
  • 作者还做了单因素与多因素Cox分析,结果仍然显示ER单阳性较ER/PR双阳性HR高。

15721061-77e0bd3b83928160.png

基因与表观遗传改变导致的PR丢失

  • 使用**TCGA****数据库分析 PR基因的mRNA表达,蛋白表达,与CNA, 启动子甲基化的关系,综合分析。多组学数据也恰恰是 TCGA数据库的优势所在(仅展示部分结果)。
15721061-3e9f22a131c03657.png
image.png
* * *

IHC找出ER单阳性组中的非luminal亚型

  • 应用TCGA****数据库对三种乳腺癌进行 PAM50分型,并对 luminal-likenon-luminal** 组进行常规的差异分析,做 KEGG富集分析,以及一些常规的分析。

    15721061-f84d29ef39a88d6c.png
    image.png

  • 找到分型的候选基因,选择几个用作免疫组化marker。ER单阳性PAM50各亚型的内分泌治疗敏感性分数展示(可计算)。作者自身的前瞻性分析结果证实内分泌治疗在ER单阳性乳腺癌组确实没有表现出生存差异,可指导临床治疗。

15721061-2bc09d4dfe6853a0.png
image.png
* * *

总结

  • 这篇文献充分有效的应用了现有大规模肿瘤数据库,进行多维度,深层次的数据挖掘。小伙伴们,可别说数据挖掘都是灌水了(不然你灌一个试试)
    15721061-6b1c3a67c5106b7f.png

    ,还是咱自己多动动脑吧。

    扫描二维码关注公众号,回复: 5238622 查看本文章
  • 个人认为本文有很好的借鉴意义,分享给大家,希望对大家有帮助。附上文献原文链接。文献下载http://www.thno.org/v08p6386.htm

本文已投稿至生信人微信公众平台,欢迎关注

猜你喜欢

转载自blog.csdn.net/weixin_34297300/article/details/87539211
今日推荐