群体遗传参数

1  Theta (\( \theta \))

群体遗传学中,在中性 Wright-Fisher 模型 (neutral Wright-Fisher model) 下,尺度参数为

\( \theta = 4N\mu \)

为每世代平均突变数的两倍。其中,\( N \) 为有效群体大小 (effective population size),\( \mu \) 为每世代个体突变率 (Klein et al. 1999)。

2  Watterson's estimator

Watterson GA (1975) Theoretical Population Biology 7:256-276

Carlson CS, et al. (2005) Genome Res 15:1553-1565

\( \theta = \frac{S}{ \sum_{i=1}^{n-1} \frac{1}{n} } \)

其中,\( S \) 为分离位点 (segregating site) 数目,\( n \) 为个体数。

2.1  计算

vcftools --vcf geno.vcf --SNPdensity 100000

\( \theta_w = \frac{SNP\_COUNT}{\sum \frac{1}{1} + \frac{1}{2} + ... + \frac{1}{n-1}} \)

3  Nucleotide diversity

Nei M, Li WH (1979) PNAS 76:5269-5273

Carlson CS, et al. (2005) Genome Res 15:1553-1565

\( \pi = \sum_{ij} x_i x_j \pi_{ij} \)

其中,\( x_i \) 为第 \( i \) 个序列的频率,\( π_{ij} \) 为第 \( i \) 个序列和第 \( j \) 个序列间核苷酸差异数目 (the number of nucleotide differences)。

3.1  计算

vcftools --vcf geno.vcf --site-pi
vcftools --vcf geno.vcf --window-pi 100000 --window-pi-step 25000

猜你喜欢

转载自www.cnblogs.com/hjbreg/p/11827535.html