Datos de colocalización y preparación del entorno.

Datos de colocalización y preparación del entorno.

1. Preparación de datos
Si necesita realizar la co-localización eqtl-GWAS, debe seguir el tutorial del objetivo del medicamento y colocar los datos eqtl en el directorio smr.
Si se trata de una co-localización GWAS-GWAS pura que involucra datos locales, necesita organizarlo en formato SNP de plantilla y requiere chr, pos, sampleize

Los GWAS de datos en línea se procesarán utilizando los paquetes ieugwasr y gwasglue.

Si los datos locales no tienen una columna de tamaño de muestra después de la descarga, puede usar el siguiente código para agregarlos.

Agregar tamaño de muestra a los datos locales

add_samplesize("文件名.txt", 10000)



2. Preparación del entorno del paquete R
Después de actualizar MendelR a 6.0 o superior, puede usar el método prepare_colocalization() para preparar paquetes R relacionados,
principalmente:
snpStats (usado para analizar datos snp)
coloc (el paquete principal de R para co-localización, usando el método bayesiano)
locuscomparer (paquete de visualización)
ieugwasr (interfaz para extraer datos de la base de datos mrbase)
gwasglue (procesamiento de datos ieu en línea)

 

 

prepare_colocalization()#准备共定位相关的包


El paquete MendelR integra el preprocesamiento de datos de los dos métodos anteriores, así como el juicio y las indicaciones de varias condiciones de contorno. Si hay datos locales al usarlo, prepare los datos en el directorio de trabajo y luego use una línea de código para analice los resultados deseados.

Para un uso específico, vaya a:

 Análisis con un solo clic de eQTL-GWAS

mr_coloc_eqtl2gwas("HMGCR", "ieu-a-300")

        

     1. Preparación de datos

       1.datos eqtl, almacenados en el directorio smr

       2.gwas datos, divididos en línea y local,

        Los datos en línea no necesitan ser procesados ​​de ninguna manera, el código se ha hecho compatible

        Los datos locales deben organizarse de acuerdo con el formato SNP de la plantilla y deben tener chr, pos, sampleize

proceso:

1. A partir de datos eqtl o esta parte del gen SNP

2. Con base en esta parte del SNP, obtenga el SNP correspondiente al rango de datos en línea o datos locales

3. Organice los datos en formato colocal.

4. Realizar análisis y visualización de colon.

3. Explicación de parámetros

?mr_coloc_eqtl2gwas

Uso: similar al código de análisis con un solo clic de smr

Se debe prestar especial atención a:

gwas_type: El tipo de fenotipo gwas cc es una variable categórica y quant es una variable continua

gwas_s: representa la proporción de caso/tamaño de muestra, como caso1000, tamaño de muestra200000, s=1000/200000=0.005

eqtl_samplesize: tamaño de muestra de datos eqtl, valor predeterminado eqtlGen 31864



三、共定位引用
locuscomparer画图:
https://github.com/boxiangliu/locuscomparer
Si utiliza locuscompare, cite el siguiente artículo: Abundantes asociaciones con la expresión genética complican el seguimiento de GWAS | Nature Genetics
Boxiang Liu, Michael J. Gloudemans, Abhiram S. Rao, Erik Ingelsson y Stephen B. Montgomery (2019) Abundantes asociaciones con la expresión genética complican el seguimiento de GWAS, Nature Genetics

coloc
https://github.com/chr1swallace/coloc

四、图例说明

imagen.png


La imagen de la izquierda representa la distribución de SNP en GWAS y QTL -log10(p). Cuanto menor es el valor de p, más alto está por encima del eje Y. Las dos tablas separadas de la derecha representan la distribución de QTL y
GWAS ellos mismos (la abscisa es la posición pos snp)
La ordenada representa el valor -log10(p) del SNP en los datos GWAS/QTL. Cuanto mayor es el valor, menor es el valor p. El SNP principal está en la parte superior.
R2 es el grado de vinculación entre un determinado SNP y el SNP principal en la población correspondiente.
Muestra principalmente el desequilibrio de enlace de los SNP en los datos
. El SNP marcado es el valor más grande de PPH4 en los dos datos. Específicamente, cada SNP tiene datos correspondientes a H1 ~ H4. Verifique el

rsid marcado en los datos de colocalización en el resultados. , es el valor mínimo de la suma de pval en los dos datos, es decir, leadSNP

 

Supongo que te gusta

Origin blog.csdn.net/weixin_46587777/article/details/132368982
Recomendado
Clasificación