癌症蛋白质分析利器:癌症蛋白质组图谱(TCPA)

                 


摘要

反相蛋白阵列(RPPA)代表了一种功能强大的功能性蛋白质组学方法,可以以经济有效,灵敏和高通量的方式在许多样本中评估相当数量的选定蛋白质标记。这种基于定量抗体的检测方法已被广泛用于研究驱动肿瘤起始/进展的分子事件,并评估生物标志物和机制。并且当前的RPPA平台包含大约300个蛋白质标记物,涵盖所有主要的癌症信号传导途径。癌症蛋白质组图谱(TCPA,http://tcpaportal.org)是一个侧重反相蛋白阵列(RPPA)的网站,其中包含两个独立的Web应用程序第一个着眼于患者肿瘤的RPPA数据,其包含癌症基因组图谱中32种癌症类型约8000个样本另外约500个来自独立患者队列的样本。第二个应用侧重于癌细胞系的RPPA数据,包含19个谱系的> 650个独立细胞系。许多这些细胞系都有公开的高质量DNA,RNA和药物筛选数据。 TCPA提供各种分析和可视化模块,帮助癌症研究人员以有效和直观的方式探索这些数据集。



 门户分为三个版块:数据集,分析,可视化。

(i)“数据集”模块提供了在TCPA中策划的样本和蛋白质标记的详细信息,以及用于数据下载的树状视图界面; “摘要”模块中查看样本信息,如数据来源,癌症类型,样本数量和抗体数量。而且,通过点击每个数据集的“显示”按钮,用户可以获得关于如何处理和规范数据的更详细的信息。通过“下载”模块,在树视图菜单中选择感兴趣的数据集。对于每个数据集,网站提供level 3和level 4数据,level 3数据代表来自独立批次的归一化数据,level 4数据代表多个批次的合并数据。这些数据已经预压缩在一个zip文件中。在分析单个批次中生成的数据方面,level 3和level 4数据是相同的;当分批分析数据时应该使用level 4数据。下载并解压缩数据后,用户可以在同一文件夹中找到数据集元数据以及RPPA数据矩阵。“我的蛋白质”模块提供了关于评估的每个蛋白质标记物的详细信息,从而可以获得相应的基因,验证状态,抗体来源和目录号。该模块还可以显示不同癌症类型的蛋白表达水平。


 (ii)“分析”模块使用户能够执行各种常见的以蛋白质为中心的分析,包括相关性,差异表达,患者存活和药物敏感性分析;对于“相关分析”,用户可以检查两种蛋白质的表达水平是否相互关联。通过这个模块,用户可以选择癌症类型/谱系的RPPA数据集,并在表格视图中获得所有的成对相关性。前两列显示蛋白质对,其次是相关系数和相应的P值。此外,通过单击加号,可以将散点图中的数据可视化。另一个有用的分析是“差异表达”。对于患者肿瘤样品,用户可以确定哪种蛋白在任何两种肿瘤类型或亚型之间差异最大。对于癌细胞系,用户可以鉴定哪些蛋白质在具有和不具有突变基因的细胞系之间差异表达。另外,患者队列应用包含“生存分析”的独特模块,细胞系应用包含“蛋白质 - 药物分析”的独特模块。这两个模块可用于识别潜在的预后和预测性蛋白质标记。可以使用“蛋白质 - 药物分析”来评估哪种药物与该蛋白质相关。

 

(iii)“可视化”模块允许用户交互式地检查全局RPPA数据模式。TCPA提供了两个创新的可视化模块,用于探索RPPA数据集的全局模式。一个是“网络”可视化,其中蛋白质标记是节点,交互是连接两个节点的彩色边缘。另一个模块是“NG-CHM”可视化。这种动态的交互式热图模块使用户能够直观地检查每种癌症类型或细胞系谱系的全局蛋白表达模式。


下图为癌症蛋白质组图谱概述:

图片


A
RPPA数据的信息流。 BTCPA门户概述。 C:“摘要”模块。 D:“下载”模块。 E:“我的蛋白质”模块用于患者队列数据。 F:用于细胞系数据的“我的蛋白质”模块。 G:患者队列数据的“相关分析”。 H:细胞系数据的“相关性分析”模块。 I:患者队列数据提供了“差异表达”模块。 J:“患者生存”模块。 K:蛋白质“药物 - 蛋白质”模块。 L:药物“药物 - 蛋白质”模块。 M:患者队列数据的“网络”可视化放大视图,左上角为全视图的快照。 N:放大细胞系数据的“网络”可视化视图。 O:“NG-CHM”可视化,左上角有完整视图的快照。



参考文献:


Li,J., et al., Explore, Visualize, and Analyze Functional Cancer Proteomic DataUsing the Cancer Proteome Atlas. Cancer Res., 2017. 77(21): p. e51-e54.




往期「精彩内容」,点击回顾

DNA测序历史 | CircRNA数据库 | Epigenie表观综合 | 癌症定位

BWA介绍  |  源码安装R包 | CancerLocator  | lme4 | 450K分析

乳腺癌异质性 BS-Seq  | 隐马模型 | Circos安装 |  Circos画图

KEGG标记基因 |  GDSC  |  Meta分析  |   R线性回归和相关矩阵

精彩会议及课程,点击回顾

计算表观遗传学大数据前沿学术论坛会议记实

哈尔滨医科大学2017年全国生物信息学暑期学校

2017龙星课程系列(一)

2017龙星课程系列(二)
2017龙星课程系列(三)

2017龙星课程系列(四)

2017龙星课程系列(五)


猜你喜欢

转载自blog.51cto.com/15127592/2673673