全长转录组测序

全长转录组测序

转录组从广义上讲,是指细胞或组织内全部 RNA 的总和,而总 RNA 依据不同的 分类标准有着不同的类型,如依据是否翻译成蛋白而分为编码 RNA (coding RNA)和非 编码 RNA (non-coding RNA);依据长短而分为长 RNA (long RNA, 长度大于 200bp)和短 RNA (small RNA, 长度小于 200bp);依据翻译中行使不同的功能主要分为信使 RNA (message RNA, mRNA)、转运 RNA (transfer RNA, tRNA)、核糖体 RNA (ribosomal RNA, rRNA)。由于 mRNA研究较多,一般的转录组测序主要针对于 mRNA[7],与此同时也可 以测到部分长非编码 RNA (long non-coding RNA, lncRNA)。

二代高通量测序技术在转录组方面的应用被称为 RNA 测序(RNA Sequencing, RNASeq),RNA-Seq 由于其高通量的优势以及日益下降的成本,在转录组方面的应用到现 在在研究领域中已经基本取代了基因芯片(micro array)技术。然而,二代测序首先读长 较短,现在应用最多的是双端150bp测序,测出的片段需要拼接才可以形成转录本,对 于转录本的还原度较差;其次,在建库中经过多次 PCR 扩增,容易造成差异分析中假 阳性概率上升[8]。

三代测序技术尤其是 PacBio 公司基于单分子实时测序技术(Single Molecule Real Time sequencing, SMRT)为转录组打造的全长转录组测序(Isoform Sequencing, Iso-Seq)流 程,已经成为国内外研究中新的热点。其在优势主要表现在读长较长,所测得数据无 需组装从而可以减少拼接错误,但是价格昂贵又限制了其测序通量无法做到像二代数 据一样高[9]。 本研究在分析中选用三代测序技术数据与二代数据相结合,将二代数据与三代数 据混合之后去冗余,而非仅用二代数据进行矫正和定量分析,减少了一般分析中对于 二代数据的浪费。为三代无参转录组测序数据分析提供了新方法。

猜你喜欢

转载自blog.csdn.net/u010608296/article/details/121255510