DART: a fast and accurate RNA-seq mapper with a partitioning strategy DART:使用分区策略的快速准确的RNA-seq映射器

DART: a fast and accurate RNA-seq mapper with a partitioning strategy
DART:使用分区策略的快速准确的RNA-seq映射器

Abstract

Motivation(动机):

近年来,大规模并行cDNA测序(RNA-Seq)技术已成为提供高分辨率测量表达和检测低丰度转录本的高灵敏度的强大工具。

但是,RNA-seq数据需要大量的计算量。

最根本和关键的步骤是将每个序列片段与参考基因组进行比对。近年来已经开发了各种从头拼接的RNA排列器。

虽然这些对齐器可以处理拼接对齐和检测拼接连接,但仍有一些挑战仍然有待解决。

随着测序技术的进步以及ENCODE项目中正在进行的测序数据的收集,高度需要更高效的比对算法。大多数读取映射器遵循传统的种子扩展策略来处理序列比对的不精确匹配。

但是,扩展比播种步骤花费更多时间。

 Results:

我们提出了一种新的RNA-seq de novo映射算法,称为DART,采用分区策略来避免扩展步骤。

合成数据集和实际NGS数据集上的实验结果表明,与大多数最先进的对准器相比,DART是一种高效的对准器,可以产生最高或可比的灵敏度和准确度,更重要的是,
它在选定的对准器中花费最少的时间。

1.Introduction

转录组分析是基因组结构和活性的全基因组研究。它涉及新型转录本的鉴定和基因表达的量化。DNA微阵列技术是研究基因表达水平的非常流行的方法。然而,探针 - 靶标杂交限制了表达测量的准确性,并且也限制了仅研究设计探针的那些基因(Zhao等,2014)。 随着近年来新一代测序(NGS)平台的出现,大规模并行的cDNA测序(RNA-Seq)技术已成为另一个强大的工具在检测低丰度转录本时提供高分辨率的表达和高灵敏度测量。RNA-Seq不需要事先基因注释,因此能够研究未知的转录物。

最近的研究表明RNA-Seq在转录组分析中显示出超过微阵列的优越性,尽管DNA微阵列是不可替代的,并且它们在进行转录谱分析实验时仍被广泛使用(Fu等人,2009; Sirbu等人,2012; Zhao等人,2014)。

其中一个主要原因是RNA-Seq数据分析要复杂得多。它需要大量的计算工作。典型的人类RNA测序实验可以产生高达数十亿个短序列片段。RNA-Seq分析中非常重要的关键步骤是将每个序列片段(或阅读)与参考基因组进行比对,随后进行基因的定量和差异表达基因的鉴定(Garber等,2011)。

猜你喜欢

转载自www.cnblogs.com/wangprince2017/p/9240198.html