第一代测序(Sanger测序)

发明人Frederick Sanger简介
1918年8月13日,Frederick Sanger出生于英国格洛斯特郡(Gloucestershire),
1939年毕业于剑桥大学圣约翰学院,并获得学士学位,
从1940年到1943年,他与Dr. a .Neuberger一起研究赖氨酸的代谢,并于1943年获得博士学位,
1955年,他测定出完整胰岛素序列,这项研究使他单独获得了1958年的诺贝尔化学奖。
1975年,他和考尔森(Coulson)共同开创链终止法(Sanger法),
1977年,他利用此技术成功测定了第一个基因组序列——噬菌体X174,全长5375 base pair。这项技术是使Frederick Sanger于1980年第二次获得诺贝尔化学奖,这项研究后来成为人类基因组计划等研究得以展开的关键技术之一。

图中展示基因组测序的发展历程

Sanger测序原理
在这里插入图片描述
DNA双链是依靠两条DNA单链间的氢键、二硫键等分子间作用力进行碱基互补配对而形成复杂的高分子化合物,G与C三个氢键,A与T两个氢键,高温时DNA双链解旋,退火后,通过两条链通过碱基互补配对可以复合成DNA双链。而DNA单链是由四种脱氧核糖核苷酸(A,T,G,C)通过3’,5’-磷酸二酯键交替连接,3’,5’-磷酸二酯键形成后脱去1分子水,属于共价键,因此,高温不会断裂,但其形成需要3’端有-OH(羟基),Sanger测序法就是利用这一点,将去掉3’端-OH的四种特殊碱基作为DNA扩增时的终止位点,并在四种特殊碱基上加有荧光颜色标记便于检测定位(A:绿色,C:蓝色,G:黄色,T:红色)。这样同一个引物会扩增出不同长度的序列,也就是说,这些扩增产物具有共同的起始点,但终止在不同的的核苷酸上。然后通过凝胶电泳和放射自显影后,根据电泳带的顺序和位置,确定每一位置是哪一种脱氧核糖核苷酸,进而确定扩增的DNA序列,通过碱基互补配对原则,可推断待测序列。

具体步骤
体系:Sanger法测序由四个单独的反应体系构成,每个反应系统包含:目标片段、四种脱氧核糖核苷酸(dNTP)、DNA聚合酶,引物,另外在每个体系中,分别加入一种去掉3‘-OH的脱氧核糖核苷酸(ddNTP)。

扩增:加热到96°C,DNA双链打开,50°C,与引物结合,60°C,以目的片段为模板,在DNA聚合酶的催化下,从引物处起始开始复制DNA,当遇到ddNTP后,不能再形成磷酸二酯键,反应停止,DNA聚合酶从DNA链上脱落下来。由于反应体系中dNTP与ddNTP相对浓度的调节,使反应扩增得到一组长几百至几千碱基的链终止产物。这里是ddNTP与dNTP在复制过程中结合到延长链上的几率,如果ddNTP浓度高,结合几率高,阻碍链延长的几率就高,那么目的片段复制的长度就短。

电泳:使用高分辨率变性丙烯酰胺凝胶将不同长度的DNA片段分开(这种电泳的精度很高,可以精确到1个bp),电泳由四个泳道组成,每个泳道对应一种碱基。然后,对凝胶处理后可用X-光胶片放射自显影或非同位素标记进行检测。片段越短,跑得越快,条带从下往上便对应着相对位置的脱氧核糖核苷酸。

序列读取:最后通电开始跑条带,在电流与凝胶阻力的作用下,纵向会出现具有相同间隔有规律的条带,它代表着不同的序列长度,在横向分别对应ATGC。可以读出下图的DNA片段序列为 5’-GATTCGAGCTGA-3’。现在推断模板链(也就是待测片段)为 3’-CTAAGCTCGACT-5’
在这里插入图片描述
优点
测序读长可达1000bp,准确性高达99.999%。
缺点
但测序成本高,通量低。

一代测序注意问题

完全引用大神笔记: https://www.cnblogs.com/wangprince2017/p/9819637.html

1.测序结果不到800Bases是什么原因?

(1)G/C rich、G/C Cluster。
这种情况一般表现为测序信号突然减弱或消失(图1,图2)
如在DNA样品中的DNA序列分布匀称,没有复杂结构时,正常的测序反应能保证达到800Bases以上。但有一些DNA样品立体结构复杂,造成聚合酶延伸反应终止,测序信号突然减弱或消失,或者测序结果出现套峰现象,出现这些现象的原因由DNA模板本身所造成。

在这里插入图片描述
图1 GC引起的信号减弱

在这里插入图片描述
图2 G/C rich引起的信号消失

(2)A、T的Poly结构

这种情况一般表现为A、T连续结构后面的测序结果出现套峰。根据文献记载。原因在于聚合酶进行聚合反应时,由于A或T的连续,聚合酶难以识别完整的每个A或T,在某个A或T的后面便开始进行A或T连续结构以后序列的聚合反应(打滑现象),造成测序结果紊乱,出现套峰。一般在多少个A或T的后面能出现这种情况呢?现在还没有这方面的报道。根据我们的经验,这一情况的出现和A或T的连续结构后面的序列的排列情况有着直接的关系。有时10多个A或T的连续结构后面便出现套峰,但有时60~70个A或T的连续结构后面的序列也一样可以完整地读出来。具体情况还有待考证。一般来说,PCR片段直接测序时,A或T的连续结构后面的序列测序结果都会出现套峰。原因在于测序时经历了PCR反应及测序反应(测序反应本身也是PCR反应)二次聚合酶的打滑现象。

在这里插入图片描述
图3 polyA引起的套峰

(3)原因不明的复杂结构,测序结果出现突然信号减弱或消失
从序列上看,DNA碱基排列并无特别异常。估计是DNA整体出现复杂结构,从某一位置开始聚合酶的聚合反应便无法进行。
在这里插入图片描述
图4 复杂结构引起的信号中断

2.出现套峰是什么原因?

在测序反应中,模板或引物的原因都可能造成套峰的形成,归结其形成原因有以下几点:

(1)测序引物在模板上有两个结合位点(图5);
(2)模板不纯,如果是质粒或是菌液,原因是非单克隆(图6),如果是PCR,原因为非特异性条带(图7);
(3)模板序列的特殊结构,如poly结构、发卡结构等(图8);
(4)引物降解,或引物不纯(图9,图10)。

在这里插入图片描述

图5 双引物结合位点引起的套峰

在这里插入图片描述

图6 由于质粒或菌液为非单克隆引起的套峰

在这里插入图片描述

图7 PCR为非特异性条带引起的套峰

在这里插入图片描述
图8 模板特殊结构引起的套峰

在这里插入图片描述

图9 引物轻微降解或引物不纯引起的套峰

在这里插入图片描述

图10 引物严重降解或引物不纯引起的套峰

解决方案汇总

1.样品测序无信号

可能是引物结合位点不存在或被破坏;建议更换引物测序或重新提供样品测序。

2.样品测序信号差

可能是引物或模板的质量不高或是引物和模板的匹配性不好引起的,也可能是样品浓度偏低;建议提供高质量样品测序。

3.样品测序衰减

可能是由于特殊结构如Poly结构、重复序列、回文结构、发卡结构、GCrich、AT富集等导致的测序衰减,由于是样品本身结构问题无法优化建议反向测序进行拼接以得到完整序列,还有一种衰减的情况就是在一段正常峰型后逐渐衰减,可能是模板量反应量不足导致,建议制备高浓度模板测序。

4.样品测序套峰

套峰细分的话有如下几种情形:

①全双峰:多引物结合位点(针对菌液、质粒样品),非特异性扩增(针对PCR产物);

②前双峰:多引物结合位点,其中一套模板测序中断(针对菌液、质粒样品),多引物结合位点(PCR未纯化样品),引物二聚体或小片段干扰(针对PCR已纯化样品);

③中间双峰:非单克隆(针对质粒、菌液样品),碱基缺失或等位基因双模板(针对PCR未纯化样品);

④后双峰:非单克隆(针对菌液、质粒样品),碱基缺失(针对PCR样品);

针对二聚体及小片段干扰的情况建议电泳切胶回收纯化;针对多引物结合位点的情况建议更换引物测序或反方向测通样品;针对碱基缺失建议克隆测序;针对非单克隆建议在克隆无误的前提下重新挑取单克隆测序;针对非特异性扩增建议优化反应条件重新制备样品测序;针对等位基因双模板建议克隆测序。

5.样品测序中断

可能样品存在特殊高级结构,导致dNTP和ddNTP在某一碱基位点后无法与模板结合,测序酶无法继续延伸,建议使用反向引物进行测序经拼接后可以得到完整序列;或酶切后亚克隆测序。

6.样品测序移码

测序从开端发生移码可能是引物发生降解,建议重新提供引物;测序局部出现移码,可能样品存在特殊高级结构,建议反向测通。

7.样品测序底峰干扰

可能测序引物不纯,建议将引物进行PAGE胶纯化后在进行测序或重新提供引物测序;可能测序样品不纯,混有正、反向引物,建议重新制备样品测序。

除了Sanger法之外还出现了一些其他的测序技术,如焦磷酸测序法、链接酶法等。其中,焦磷酸测序法是后来Roche公司454技术所使用的测序方法,而连接酶测序法是后来ABI公司SOLID技术使用的测序方法,但他们的共同核心手段都是利用了Sanger中的可中断DNA合成反应的dNTP。

猜你喜欢

转载自blog.csdn.net/R_python/article/details/107782972