El subprograma de lenguaje R autoescrito ayuda a la extracción de datos de aleatorización mendeliana (aleatorización mendeliana)

Hemos hecho una introducción preliminar a la aleatorización mendeliana en los dos números anteriores. Los pasos de la aleatorización mendeliana son relativamente simples y fijos. Hay 3 pasos en total. Sin embargo, si analizamos las variables de investigación y los datos de resultados uno por uno, tomará mucho tiempo. Escribí un pequeño programa R para ayudarnos con la extracción de datos.
inserte la descripción de la imagen aquí
De hecho, es un pequeño programa muy simple, que contiene principalmente los pasos de la aleatorización mendeliana y utiliza bucles dobles para unir las variables de investigación y las variables de resultado. El cuerpo de la función es

Mendelian.help (exposure,outcome)

La exposición es nuestra variable de investigación y el resultado es nuestra variable de resultado.
Supongamos que queremos estudiar dos variables causales "ieu-a-22" y "prot-b-66", y queremos estudiar tres variables de resultado "finn-b-O15_MEMBR_PREMAT_RUPT", "ukb-b-12621", "finn-b-O15_PLAC_PREMAT_SEPAR", si lo hacemos uno por uno, tomará una cierta cantidad de tiempo, y si hay más variables, tomará más tiempo.
Primero definimos las variables de exposición y las variables de resultado

exposure<-c("ieu-a-22","prot-b-66")

outcome<-c("finn-b-O15_MEMBR_PREMAT_RUPT","ukb-b-12621","finn-b-O15_PLAC_PREMAT_SEPAR")

Luego genera el resultado, muy simple.

out<-Mendelian.help(exposure=exposure,outcome=outcome)

inserte la descripción de la imagen aquí
De esta manera, se generan los resultados. Podemos ver la coincidencia de cada variable de exposición y la variable de resultado, y ver si es significativa. Personalmente, creo que es útil para la detección de variables a gran escala. La detección del valor de P es el valor de P extraído por la varianza inversa ponderada, el método más importante en la aleatorización mendeliana del valor de P.

inserte la descripción de la imagen aquí
Sin embargo, esta función también tiene algunas deficiencias, la primera es que descarga datos en línea, si su red no es buena y no se pueden descargar los datos, informará un error, por lo que se realiza cuando la red es relativamente buena (como durante el día). Como se muestra en la siguiente figura, los datos no se pueden descargar

inserte la descripción de la imagen aquí
La segunda es que si extrae solo 1-2 datos SNP en el primer paso, es posible que no haya una coincidencia en el segundo paso y se informará un error.

Finalmente, aunque este es un pequeño programa muy simple sin contenido técnico, también está concebido y no se puede publicar en la calle mala de forma gratuita.Si necesita una respuesta de cuenta pública: código, puede obtener el programa.

Supongo que te gusta

Origin blog.csdn.net/dege857/article/details/131548009
Recomendado
Clasificación