メンデルランダム化 (Mendelian Randomization) データマイニングを支援する自作の R 言語アプレット

前の 2 回でメンデルランダム化について予備的な紹介をしました. メンデルランダム化のステップは比較的単純で固定されています. 合計 3 つのステップがあります. しかし, 研究変数と結果データを 1 つずつスクリーニングすると, かなりの時間がかかります. データマイニングを支援するために小さな R プログラムを書きました.
ここに画像の説明を挿入
実際、これは非常に単純な小さなプログラムであり、主にメンデルランダム化のステップがパックされており、研究変数と結果変数を照合するために二重ループを使用しています。関数の本体は

Mendelian.help (exposure,outcome)

エクスポージャーは研究変数であり、結果は結果変数です。
2 つの因果変数「ieu-a-22」と「prot-b-66」を調査し、3 つの結果変数「finn-b-O15_MEMBR_PREMAT_RUPT」、「ukb-b-12621」、「finn-b-O15_PLAC_PREMAT_SEPAR」を調査したいとします。1 つずつ行うと、ある程度の時間がかかります。さらに変数が多い場合は、 s、さらに時間がかかります。
まずエクスポージャー変数と結果変数を定義します

exposure<-c("ieu-a-22","prot-b-66")

outcome<-c("finn-b-O15_MEMBR_PREMAT_RUPT","ukb-b-12621","finn-b-O15_PLAC_PREMAT_SEPAR")

次に、非常に簡単な結果を生成します。

out<-Mendelian.help(exposure=exposure,outcome=outcome)

ここに画像の説明を挿入
このようにして結果が生成されるのですが、各エクスポージャー変数とアウトカム変数のマッチングを見て意味があるかどうかを確認することができるので、大規模な変数のスクリーニングに役立つと個人的には思います。P 値のスクリーニングは、P 値のメンデルランダム化において最も重要な方法である逆分散重み付けによって抽出された P 値です。

ここに画像の説明を挿入
ただし、この機能には欠点もあり、まずオンラインでデータをダウンロードするため、ネットワークが悪くダウンロードできない場合はエラーが発生するため、ネットワークが比較的良好な時間帯(日中など)に実行されます。下図のようにデータがダウンロードできない

ここに画像の説明を挿入
2 つ目は、最初のステップで 1 ~ 2 個の SNP データのみを抽出した場合、2 番目のステップで一致しない可能性があり、エラーが報告されます。

最後に、これは技術的な内容のない非常に単純な小さなプログラムですが、これも考案されており、無料で悪路に投稿することはできません。公開アカウントの返信コードが必要な場合は、プログラムを入手できます。

おすすめ

転載: blog.csdn.net/dege857/article/details/131548009