第三代测序技术的兴起

第三代测序技术的兴起

DNA作为生物遗传信息的载体,其序列的获取对于探索生命奥秘至关重要。DNA测序技术无疑已经成为生物学研究中最常用的技术手段。自20世纪70年代中期DNA测序技术出现以来的40年,DNA测序技术取得了飞跃式的发展,同时也推动着生命科学领域及其相关交叉学科领域的极速发展。

1977年,Sanger等的双脱氧核苷酸末端终止测序法和Maxam、Gilbert的化学降解测序法开启了解密生命信息的大门,在这两种方法的基础上发展起来的荧光自动化测序技术、毛细管电泳测序技术、杂交测序技术等都属于第一代测序技术。第一代测序技术在最初的基因组谱图测序工作中起到了关键作用,小到噬菌体基因组,大到人类基因组计划,第一代测序技术凭借其超过1 000 bp的读长及高达99.999%的原始数据准确率仍在目前的市场应用中占有一定的比例。但其测序通量较低、速度较慢、时间较长、成本较高已经无法满足大规模的测序任务。

以高通量、低成本为特征的第二代测序技术应运而生。它的原理主要是将DNA片段固定在固体表面,通过PCR扩增,进行边合成边测序。其代表主要有Roche公司以焦磷酸测序为原理的454测序技术、Illumina公司以合成测序为原理的Solexa测序技术、ABI公司以连接酶技术开发的SOLiD测序平台。通量高、速度快、价格低的第二代测序技术很快得到了广泛应用。然而,第二代测序技术也有不可忽略的弊端,其较短的读长给序列的组装拼接带来困难,另外,由于第二代测序依赖PCR扩增,G+C含量异常的基因组测序结果将受到影响。

第三代测序技术以单分子测序为特点已逐渐崭露头角。它在纳米级的反应空间内对DNA进行单分子水平的边合成边测序。该方法有着更快的数据读取速度,测序读长可达到20 kb,不再需要PCR扩增,进一步简化测序步骤,降低测序成本,提高测序通量和数据产出。单分子测序通过检测原始状态的样本获取更直接真实的遗传信息,实现了RNA和核酸修饰的直接测序。第三代测序技术以其无与伦比的优势取得了越来越多的关注和应用。已出现的第三代测序技术主要有Helicos Biosciences公司研发的单分子测序(True single molecular sequencing,tSMSTM)技术及单分子测序仪(HeliScope Single Molecular Sequencer),Pacific Biosciences公司研发的单分子实时(Single molecule realtime,SMRT)测序技术平台,Visi GenBiotechnologies公司研发的荧光能量共振转移(Fluorescence resonance energy transfer,FRET)测序技术,Oxoford Nanopore Technologies公司研发的纳米孔单分子测序(Single-molecule nanopore DNA sequencing)技术。目前,当属Pacific Biosciences公司运用SMRT单分子实时测序技术的PacBio RS系列测序仪在商业化中有较好的应用。

在检测DNA修饰方面,一代测序虽然可以检测到一部分被修饰的碱基,但它并没有在这方面得到广泛应用;而二代测序由于其依赖的DNA扩增会抹掉DNA修饰信息,需要对样本进行预处理来区别修饰和未被修饰的核苷酸再进行测序,如利用亚硫酸氢盐将胞嘧啶转化为尿嘧啶而甲基胞嘧啶不变从而检测出甲基胞嘧啶,处理过程繁琐且方法、效率有限,造成DNA修饰的检测在二代测序中的难度;三代测序中的单分子实时测序技术,无需样本预处理,通过测序过程中DNA聚合酶动力学信息的变化,直接获得DNA修饰信息。三代测序凭借其简单直接获取修饰信息的能力将在表观遗传学研究领域发挥重大作用。

2 单分子实时测序技术2.1 SMRT测序原理

2009年,Pacific Biosciences公司推出了SMRT测序技术。SMRT测序的基本流程是首先将待测DNA打断成一定长度的片段,并进行DNA损伤修复及末端修复,再在DNA片段两端接上发夹结构的接头使DNA能够进行环化测序,纯化后将DNA样本上样到PacBio RS系列测序仪的SMRT cells中进行测序[1]。

实现单分子实时测序有赖于3个关键核心技术:

(1)磷酸-荧光基团连接的核苷酸:带有不同荧光标记的脱氧核苷酸在参与DNA合成中被检测到荧光信号。该核苷酸的荧光基团连接在磷酸基团(图 1a)上,与以往测序中使用的连接在碱基上的核苷酸不同(图 1b),在DNA聚合酶的作用下生成磷酸二酯键,该荧光标签被切除,不会保留在延伸的DNA链中对后续的DNA合成产生空间位阻影响DNA酶的活性,也不会增加背景荧光,合成和天然DNA相同的DNA链。

图 1 连接荧光基团的核苷酸

Figure 1 Nucleotides linked with fluorophore

注:A:磷酸-荧光基团连接的核苷酸;B:碱基-荧光基团连接的核苷酸[1].

Note: A: Phospho-fluorophore linked nucleotides; B: Base-fluorophore linked nucleotides[1].

(2)零模波导孔(Zero-Mode waveguides,ZMWs):测序是在厚度为100 nm的金属薄膜SMRT cells上进行的,每个SMRT cell中有150 000个ZMWs (图 2a)。ZMW是直径为10 nm−50 nm的纳米微孔,由于其短于激光的单个波长,激光无法穿过小孔而发生衍射,只照亮ZMW底部形成一个很小的检测区域,DNA聚合酶和DNA模板复合物就被固定在这个区域内,并且有约三分之一的ZMWs中只有一个DNA聚合酶,且在后续数据分析中没有DNA链或含有两条及以上DNA链的ZMWs数据会被过滤掉,从而实现单分子测序;另外,在这个空间有限的纳米结构中,游离在DNA链周围的核苷酸也十分有限,因此形成的背景荧光信号也十分稳定(图 2b)。

图 2 SMRT cell和ZMW

Figure 2 SMRT cell and ZMW

注:A:每个SMRT cell中有150 000个ZMWs;B:零模波导孔ZMW[1].

Note: A: 150 000 ZMWs in each SMRT cell; B: Zero-Mode waveguides (ZMWs)[1].

(3)实时检测:带有不同荧光标签的核苷酸进行布朗运动快速地进出ZMW,一旦某个核苷酸与模板DNA碱基互补配对就会被DNA聚合酶捕捉形成磷酸二酯键延伸DNA,这个过程时间较长,荧光基团被激光激发产生一定强度的荧光,特定的荧光信号会维持一段时间,成千上万个ZMWs中DNA合成反应平行进行,过程中产生的荧光信号通过共聚焦荧光显微镜被实时监测收集(图 3a),即无数个ZMWs中核苷酸掺入DNA链产生的荧光脉冲被实时记录下来(图 3b),再通过生物信息学分析得出相应位置上的DNA序列[1-2]。

图 3 SMRT测序的实时检测

Figure 3 Real time detection of SMRT sequencing

注:A:通过共聚焦荧光显微镜实时监测收集荧光信号;B:荧光标记的核苷酸合成DNA链产生荧光脉冲[1].

Note: A: Real-time monitoring and collecting fluorescence signals through confocal flurescence microscopy;

B: Fluorescence pulse of phospho-linked nucleotides in DNA synthesis[1].

2.2 SMRT测序的特点及应用

2.2.1 对样本的要求: SMRT测序对待测DNA样本的质量要求很高,要求基因组DNA样本在20 V的琼脂糖凝胶过夜电泳中DNA主带≥23 kb,并且没有明显的拖尾及降解现象;NanoDrop检测中OD260/280值在1.8−2.0范围内,OD260/230值在2.0−2.2范围内;Qubit检测中DNA浓度可观。这对样本DNA的提取有很高的要求。此外,SMRT测序在基因组DNA建库输入量上的要求比较低,微生物仅需100 ng,植物和动物也仅需5 μg。

2.2.2 产出数据特征: 目前,在PacBio RS Ⅱ测序仪使用P6-C4试剂测序,平均读长可达10 kb左右,一半以上的数据读长 > 20 kb,5%的读长 > 30 kb,最长可达到60 kb以上,测序速度可达到10 nt/s,单个SMRT cell的数据产出量可达500 Mb−1 Gb,每次可同时运行16个SMRT cells进行测序。超长的读长给基因组组装提供了很大便捷,可用于新基因组的测序工作,也可对已有基因组重测序进行填补缺口等完善工作[3],另外也使二代测序难以处理的含有较多重复片段的基因组组装得以实现,同时由于读长很长足以覆盖某些基因和RNA的长度,目前也已经开展无需组装的全长16S rRNA基因和全长转录本的测序应用[4-5]。通量高、数据产出量大,极大地缩短了测序时间,在短时间内即可完成对大型基因组的测序任务。 此外,在测序过程中可能由于核苷酸合成DNA速度太快超过信号接收记录频率,以及DNA随机捕捉到并不会和模板匹配的核苷酸合成DNA链所造成的单碱基缺失和插入错误,使单个SMRT cell的正确率只有87%,不过这是随机错误不是系统错误,会随着测序覆盖度的增加而降低,甚至消除,目前使用P6-C4试剂测序至30×覆盖度,正确率可达99.999%。

2.2.3 直接测序: 单分子实时测序技术基于单分子水平利用DNA聚合酶进行边合成边测序,不需要进行模板的PCR扩增,不仅避免了扩增过程中可能引入的碱基插入错误,还简化了测序的步骤,缩短测序时间,降低测序成本;并且规避了依赖PCR扩增的二代测序中无法扩增G+C含量偏高或偏低样本的困难,无GC偏好性,有利于G+C含量异常基因组的测序和组装,也可用于对二代测序中难以完成测序的基因组区域进行完善[6]。 没有扩增步骤,直接对样本进行测序,使样本维持原始状态,保留原有的修饰信息,在DNA合成过程中,遇到被修饰的核苷酸,DNA聚合酶的停顿时间比遇到普通核苷酸的停顿时间长,通过生物信息学分析可定位被修饰的核苷酸位点,从而实现修饰位点的直接测序[7]。另外,如果用RNA逆转录酶取代DNA聚合酶,以RNA为样本模板进行DNA合成,即可实现RNA的直接测序,省去RNA的体外逆转录步骤,可以大大降低其产生的系统误差,同时也可以实现对RNA上修饰的检测。

参考文献

葛元洁, 陈实. 专论与综述[J]. 微生物学通报, 2017, 44(1): 186-199.

GE Yuan-Jie, CHEN Shi. Single molecule real time sequencing and its applications in microbial epigenetics-a review[J]. Microbiology China, 2017, 44(1): 186-199.

http://journals.im.ac.cn/html/wswxtbcn/2017/1/tb17010186.htm

发布了515 篇原创文章 · 获赞 79 · 访问量 17万+

猜你喜欢

转载自blog.csdn.net/u010608296/article/details/103514701