Piercing the dark matter: bioinformatics of long- range sequencing and mapping穿透暗物质:生物信息学的长程测序和绘图

一些新的基因组学技术已经可以提供比以往更高的通量和更高的分辨率分析的长读序列或长期绘图。
这些远程技术随着参考基因组的改进、更全面的变体识别和更完整的转录组和表观基因组的观点而迅速推进该领域。
然而,它们也需要新的生物信息学方法来充分利用它们的独特特性,同时克服它们复杂的错误和模式。
在这里,我们讨论了新技术的几个最重要的应用,集中在当前可用的生物信息学工具和未来研究的机会

       上世纪80年代末和90年代,第一代测序技术的发展对第一批微生物、植物和动物基因组的测序,包括人类基因组的初步测序至关重要。
这一代最重要的技术是自动桑格测序仪,它可以一次对数百个DNA分子进行测序。
还为这些早期项目开发了若干支持性生物技术,包括配偶配对、细菌人工染色体(BACs)、光学绘图和其他分析,以增加可产生的相对有限的序列。
在21世纪的中后期,高通量的第二代测序技术迅速取代了第一代测序,这在很大程度上是因为全基因组测序所需的成本大大降低了。
高通量短读测序是这一代的主要发展,并辅以一些相关的生物技术,如配对端测序、聚合fosmids和改进的光学绘图技术。
这些第二代技术使许多新的基因组测序和广泛的重测序工作成为可能,以分析基因组多样性和致病变异,以及对许多物种的转录、基因调控和表观遗传学的广泛研究。
然而,尽管第二代测序技术已经实现了许多动植物物种的种群规模分析,但它也有重要的局限性,特别是对重复元素的定位较差或模糊,在图书馆建设过程中对indels或结构变异体(SVs)的跨越能力有限和扩增人工痕迹;
因此,短读序列的局限性使得大部分基因组的很大一部分无法访问,它们真正的复杂性也被隐藏起来

猜你喜欢

转载自blog.csdn.net/u010608296/article/details/113073866