pathway对高通量数据分析的重要性

在听老师将Wnt通路时,有下面的体悟:Wnt通路中,APC结合GSK3和CK1后,招募β-catenin,使β-catenin磷酸化,继而泛素化,β-catenin蛋白降解。整个过程是动态平衡的。

但是,如果APC发生变异,APC不能与GSK3和CK1结合,那么β-catenin不能被招募,不能被降解。然后,β-catenin会入核,与TCF、LEF1转录因子结合,启动基因转录,改变基因表达。继而影响生物学功能。

那么,在分析高通量测序数据(DNA/RNA测序数据)时,如果发现了成百上千个基因突变或差异表达的基因,如何下手找生物学意义呢?

我们可以结合疾病特点,从疾病特异的pathway入手。如:从上面这些基因入手。

或者,我们已经发现了APC的变异,后续怎么做呢?找基因TCF、LEF1、GSK3、CK1等基因的变异,看看这些基因是否有变异。

一方面,这又产生一个问题:这样的数据分析得到的结果,永远是已知的知识。科学研究,更多的是想得到未知的规律,而不是验证已知的规律。如何从数据分析中发现未知的规律呢?

这就还是回到了老本行:找出差异基因富集的通路和生物学过程。富集结果有可能与预期一致,有可能不一致。如果不一致,去实验验证这些富集结果。验证OK,新发现;验证NG,数据有问题。

高通量数据分析的意义有两个方面:

1.在大数据上验证某个已报道的现象;

扫描二维码关注公众号,回复: 7602984 查看本文章

2.发现未知的规律,解释未知的现象。

另一方面:

这就是数据分析人员需要与实验人员沟通的所在。他们看到APC的变异会马上想知道这些相互作用的基因TCF、LEF1、GSK3、CK1是否有变异,是否表达有差异。而,数据分析人员,只想着将有差异的基因筛选出来,借助数据库将他们放到一个可解释的生物过程(pathway、GO过程等)中。这样一来,数据分析人员就忽略了那些变异不明显但生物学意义重大的生物过程。

如何解决这个问题呢?

猜你喜欢

转载自www.cnblogs.com/zypiner/p/11738683.html