Datos de colocalización y preparación del entorno.
1. Preparación de datos
Si necesita realizar la co-localización eqtl-GWAS, debe seguir el tutorial del objetivo del medicamento y colocar los datos eqtl en el directorio smr.
Si se trata de una co-localización GWAS-GWAS pura que involucra datos locales, necesita organizarlo en formato SNP de plantilla y requiere chr, pos, sampleize
Los GWAS de datos en línea se procesarán utilizando los paquetes ieugwasr y gwasglue.
Si los datos locales no tienen una columna de tamaño de muestra después de la descarga, puede usar el siguiente código para agregarlos.
Agregar tamaño de muestra a los datos locales
add_samplesize("文件名.txt", 10000)
2. Preparación del entorno del paquete R
Después de actualizar MendelR a 6.0 o superior, puede usar el método prepare_colocalization() para preparar paquetes R relacionados,
principalmente:
snpStats (usado para analizar datos snp)
coloc (el paquete principal de R para co-localización, usando el método bayesiano)
locuscomparer (paquete de visualización)
ieugwasr (interfaz para extraer datos de la base de datos mrbase)
gwasglue (procesamiento de datos ieu en línea)
prepare_colocalization()#准备共定位相关的包
El paquete MendelR integra el preprocesamiento de datos de los dos métodos anteriores, así como el juicio y las indicaciones de varias condiciones de contorno. Si hay datos locales al usarlo, prepare los datos en el directorio de trabajo y luego use una línea de código para analice los resultados deseados.
Para un uso específico, vaya a:
Análisis con un solo clic de eQTL-GWAS
mr_coloc_eqtl2gwas("HMGCR", "ieu-a-300")
1. Preparación de datos
1.datos eqtl, almacenados en el directorio smr
2.gwas datos, divididos en línea y local,
Los datos en línea no necesitan ser procesados de ninguna manera, el código se ha hecho compatible
Los datos locales deben organizarse de acuerdo con el formato SNP de la plantilla y deben tener chr, pos, sampleize
proceso:
1. A partir de datos eqtl o esta parte del gen SNP
2. Con base en esta parte del SNP, obtenga el SNP correspondiente al rango de datos en línea o datos locales
3. Organice los datos en formato colocal.
4. Realizar análisis y visualización de colon.
3. Explicación de parámetros
?mr_coloc_eqtl2gwas
Uso: similar al código de análisis con un solo clic de smr
Se debe prestar especial atención a:
gwas_type: El tipo de fenotipo gwas cc es una variable categórica y quant es una variable continua
gwas_s: representa la proporción de caso/tamaño de muestra, como caso1000, tamaño de muestra200000, s=1000/200000=0.005
eqtl_samplesize: tamaño de muestra de datos eqtl, valor predeterminado eqtlGen 31864
三、共定位引用
locuscomparer画图:
https://github.com/boxiangliu/locuscomparer
Si utiliza locuscompare, cite el siguiente artículo: Abundantes asociaciones con la expresión genética complican el seguimiento de GWAS | Nature Genetics
Boxiang Liu, Michael J. Gloudemans, Abhiram S. Rao, Erik Ingelsson y Stephen B. Montgomery (2019) Abundantes asociaciones con la expresión genética complican el seguimiento de GWAS, Nature Genetics
coloc
https://github.com/chr1swallace/coloc
四、图例说明
La imagen de la izquierda representa la distribución de SNP en GWAS y QTL -log10(p). Cuanto menor es el valor de p, más alto está por encima del eje Y. Las dos tablas separadas de la derecha representan la distribución de QTL y
GWAS ellos mismos (la abscisa es la posición pos snp)
La ordenada representa el valor -log10(p) del SNP en los datos GWAS/QTL. Cuanto mayor es el valor, menor es el valor p. El SNP principal está en la parte superior.
R2 es el grado de vinculación entre un determinado SNP y el SNP principal en la población correspondiente.
Muestra principalmente el desequilibrio de enlace de los SNP en los datos
. El SNP marcado es el valor más grande de PPH4 en los dos datos. Específicamente, cada SNP tiene datos correspondientes a H1 ~ H4. Verifique el
rsid marcado en los datos de colocalización en el resultados. , es el valor mínimo de la suma de pval en los dos datos, es decir, leadSNP