Combination of short-read, long-read, and optical mapping assemblies reveals large-scale tandem repe

Combination of short-read, long-read, and optical mapping assemblies reveals large-scale tandem repeat arrays with population genetic implications

短读、长读和光学映射组合揭示了大规模串联重复序列阵列与群体遗传的关联

精确和连续的基因组组装是全面理解形成基因组多样性和进化过程的关键。
然而,它经常受到组成性异染色质的限制,通常以高度重复的DNA为特征。
作为与着丝粒和亚端粒区域相关的基因组结构的关键特征,它在局部影响减数分裂重组。
在这项研究中,我们评估了大型串联重复序列阵列对鸟类物种形成模型欧亚乌鸦重组率景观的影响。
我们使用单分子实时测序(long-read assembly [LR])和单分子光学图谱(optical map assembly [OM])组装了两个高质量的基因组参考文献。
包括为同一个人构造的已发布的短读程序集(SR)在内的三方面比较允许评估程序集属性并确定错误程序集。
通过结合来自所有三个组合的信息,我们在序列组合断点附近发现了36个之前未识别的大型重复区域,其中大多数包含一个14kb卫星重复序列或其1.2 kb亚基的复杂数组。
利用全基因组群体重测序数据,我们估计了群体规模重组率(ρ),发现它在这些区域显著降低。
这些发现与着丝点或亚端粒异染色质邻近区域低重组的影响一致,并增加了我们对基因组遗传多样性和分化中普遍存在异质性过程的理解。
通过结合三种不同的技术,我们的结果突出了在基因组结构上增加一层信息的重要性,这是每一种方法都无法单独获得的。

猜你喜欢

转载自blog.csdn.net/u010608296/article/details/113093177