消失的遗传力--wiki

这是wiki上消失遗传力的翻译,加上自己的理解。

消失遗传力

https://en.wikipedia.org/wiki/Missing_heritability_problem

消失遗传力的定义

“缺失遗传力”问题,是一个事实,即单个遗传变异不能解释疾病、行为和其他表型的遗传力。这是一个对医学有重大影响的问题,因为一个人对疾病的易感性可能更多地取决于“背景中所有基因的综合效应,而不是前景中的疾病基因”,或者基因的作用可能被严重高估。

前景中的疾病基因,应该是个体所具有的分型。背景应该是群体具有的分型

消失遗传力为何被提出

“缺失遗传力”问题在2008年被命名为“缺失遗传力”(以物理学中的“缺失重子问题”命名)。人类基因组计划带来了乐观的预测,即对许多性状和疾病(特别是由数量遗传学和行为遗传学确定的)的巨大遗传贡献将很快通过候选基因研究等方法绘制并固定到特定基因及其遗传变体,这些方法使用小样本和有限的基因测序来重点研究研究SNP类型的变体时,被认为涉及特定基因。虽然发现了许多点击,但在其他研究中往往无法复制。

消失的遗传力,这个属于,来源于物理学中的“缺失重子问题”

很多GWAS分析定位的基因不能重演

基因组测序成本的指数下降导致了GWAS研究的使用,该研究可以同时检查比原始发现更大样本中的所有候选基因,其中候选基因命中率几乎总是假阳性,只有2-6%的重复;[7] [8][9][10][11][12]在智力候选基因命中的特定情况下,只有1个候选基因命中复制,[13]前25个精神分裂症候选基因与精神分裂症的关系与偶然性无关,[14][15]而在15个神经影像学命中中,没有一个与之相关。[16] 行为遗传学编辑委员会指出,在为候选基因出版物制定更严格的要求时,“关于候选基因关联的文献中充满了经不起严格复制的报告……现在看来,过去十年发表的许多发现很可能是错误的或误导性的,并没有对知识的真正进步做出贡献”。[17] 其他研究人员将文献描述为“产生了无限多的出版物,几乎没有一致的复制”,并呼吁逐步淘汰候选基因研究,以支持多基因评分。[18]

遗传力很高的性状但是找到的位点却很少,遗传力消失了

这导致了一个进退两难的局面。长期以来,标准遗传学方法估计了较大的遗传率,例如身高或智力等特征的80%,然而,尽管样本量较小,但没有发现任何基因,这些样本本应能够检测出合理影响大小的变体,例如1英寸或5个IQ点。如果基因具有如此强大的累积效应,它们在哪里?

消失的遗传力来源8种

已经提出了几种解决方案,即缺失遗传力是以下因素的某种组合:

  • 第一种:双胞胎研究和其他方法因其批评者长期提出的问题而存在严重偏见;几乎没有发现遗传影响。因此,有人提出,据推测构成遗传力行为遗传估计基础的基因根本不存在[19]

遗传力估计的方法偏高,上线过高了。

  • 第二种:遗传效应实际上是表观遗传学

环境的影响也很大,有时候没有有效排除,有时候就在表观遗传中

  • 第三种:遗传效应通常是非加性的,由复杂的相互作用引起。在许多提议中,引入了一个模型,该模型考虑了复杂疾病风险和复发风险的表观遗传。[4] 引入了限制途径(LP)模型,其中特征取决于k输入值,由于化学计量比、生化途径所需的反应物或基因转录所需的蛋白质,k输入值可能具有速率限制。这些k输入中的每一个都是严格的加性特征,取决于一组常见或罕见的变体。当k=1时,线性规划模型只是一个标准的加性特征
    现在的模型是线性的,可以用更复杂的模型

  • 第四种:遗传效应不是由于候选基因研究中检测到的常见单核苷酸多态性,而是由于非常罕见的突变、拷贝数变异和其他奇异的遗传变异。这些变异往往是有害的,并通过自然选择保持在低频率。需要全基因组测序来追踪特定的罕见变异。
    稀有变异,也是一个重要的来源

  • 第五种:这些特征都是被误诊的:一个人的“精神分裂症”是由与另一个精神分裂症患者完全不同的原因引起的,因此,虽然一个病例可能涉及一个基因,但它不会涉及另一个病例,这使得gwas无效
    表型定义不准确

  • 第六种:当这些基因以高频分离时,gWASE无法检测到对表型有中度影响的基因[20]
    基因型数据maf很高,统计模型可能无效检验

  • 第七种:性状是真实的,但在国家和时间之间诊断不一致或受到基因影响,导致测量误差,再加上种族或环境造成的遗传异质性,将使荟萃分析的GWAS和GCTA结果偏向于零[21][22][23][24][25][26]
    多个来源样本,应用受限

  • 第八种:遗传效应确实是通过普通SNP的叠加作用而产生的,但具有高度的多基因性:分散在数百或数千个变体上,每个变体的影响都很小,比如一个IQ点的几分之一英寸或五分之一,并且先验概率很低:出乎意料的是,候选基因研究不太可能从数十万个已知SNP中选择正确的SNP,截至2010年,gWASE,如果n<20000,将无法找到达到全基因组统计显著性阈值的点击数。需要更大的GWAS样本量(通常大于100k)才能找到任何点击量,并且在这之后会稳步增加。
    统计模型中样本量太小

2010年引入的全基因组复杂性状分析(GCTA)支持了对缺失遗传力问题的解决,该分析表明,性状相似性可以通过额外处理的常见SNP上无关陌生人的遗传相似性来预测,对于许多性状,SNP遗传力确实是整体遗传力的很大一部分。GCTA结果进一步得到了以下发现的支持:通过线性模型,包括所有SNP,无论p值如何,都可以在无任何全基因组统计显著点击的情况下预测GWASE中的一小部分性状方差;如果没有SNP的贡献,这将是不可能的,但这将是人们对SNP的期望,其影响是通过一个太小的样本非常不精确地估计的。结合到那时为止GWASE设定的最大效应大小上限,这有力地表明高度多基因理论是正确的。随着样本量从n<20k增加到n>100k或n>300k,越来越多的大规模gWASE产生了初始命中数,然后命中数增加的复杂特征包括身高、[27]智力、[28]和精神分裂症。

猜你喜欢

转载自blog.csdn.net/yijiaobani/article/details/126134333