共局在化データと環境の準備

共局在化データと環境の準備

1. データの準備
eqtl-GWAS の共局在化を行う必要がある場合は、薬物ターゲットのチュートリアルに従って、eqtl データを smr ディレクトリに配置する必要があります。
ローカル データを含む純粋な GWAS-GWAS の共局在化の場合は、それをテンプレート SNP形式に整理する必要があり、chr、pos、samplesize が必要です

オンライン データの GWAS は、ieugwasr および gwasglue パッケージを使用して処理されます。

ダウンロード後にローカル データにサンプルサイズ列がない場合は、次のコードを使用して追加できます。

サンプルサイズをローカル データに追加する

add_samplesize("文件名.txt", 10000)



2. R パッケージ環境の準備
MendelR を 6.0 以降にアップグレードした後、prepare_colocalization() メソッドを使用して、
主に次の関連する R パッケージを準備できます
。 snpStats (SNP データの分析に使用)
coloc (共局在化用のメイン R パッケージ、ベイジアンを使用)メソッド)
locuscomparer (視覚化パッケージ)
ieugwasr (mrbase データベースからデータを抽出するためのインターフェイス)
gwasglue (オンライン IEU データの処理)

 

 

prepare_colocalization()#准备共定位相关的包


MendelR パッケージは、上記 2 つの手法によるデータの前処理と、各種境界条件の判定とプロンプトを統合したパッケージであり、使用時にローカル データがある場合は、作業ディレクトリにデータを準備し、1 行のコードで目的の結果を分析します。

具体的な使用方法については、次を参照してください。

 eQTL-GWAS ワンクリック分析

mr_coloc_eqtl2gwas("HMGCR", "ieu-a-300")

        

     1. データの準備

       1.eqtl データ、smr ディレクトリに保存

       2.オンラインとローカルに分かれた gwas データ、

        オンライン データはいかなる方法でも処理する必要がなく、コードには互換性があるため、

ローカル データはテンプレート SNP形式        に従って編成する必要があり、chr、pos、samplesize が必要です。

プロセス:

1. eqtl データまたは遺伝子 SNP のこの部分から

2. SNP のこの部分に基づいて、オンライン データまたはローカル データの範囲に対応する SNP を取得します

3.データをcoloc形式に整理します

4.結腸の分析と視覚化を実行する

3. パラメータの説明

?mr_coloc_eqtl2gwas

使用法: smr ワンクリック分析のコードに似ています

以下の点に特別な注意を払う必要があります。

gwas_type: gwas 表現型のタイプ cc はカテゴリ変数、quant は連続変数

gwas_s: ケース/サンプルサイズの比率を表します (例: case1000、samplesize200000、s=1000/200000=0.005)

eqtl_samplesize: eqtl データのサンプル サイズ、デフォルト eqtlGen 31864



三、共定位引用
locuscomparer画图:
https://github.com/boxiangliu/locuscomparer
locuscompareを使用する場合は、次の論文を引用してくださいNature Genetics
Boxiang Liu、Michael J. Gloudemans、Abhiram S. Rao、Erik Ingelsson、Stephen B. Montgomery (2019) 遺伝子発現との豊富な関連性が GWAS 追跡調査を複雑にする、Nature Genetics

coloc
https://github.com/chr1swallace/coloc

四、図例説明

画像.png


左側の図は、GWAS および QTL -log10(p) の SNP の分布を示しています。p 値が小さいほど、Y 軸よりも高くなります。右側の 2 つの別の表は、QTL と GWAS の分布を示しています
。縦軸は
GWAS/QTL データ中の SNP の -log10(p) 値を表し、値が大きいほど p 値が小さくなり、リード SNP が先頭になります。
R2 は、特定の SNP と対応する集団内のリード SNP の間の連鎖の度合いです。
データ内のSNPの連鎖不平衡を主に表示します
マークされたSNPは、2つのデータのうちPPH4の最大値です 具体的には、各SNPにはH1~H4に相当するデータがあります 共局在データにマークされたrsidを確認してください結果

. は 2 つのデータ、つまり leadSNP の pval の合計の最小値です。

 

おすすめ

転載: blog.csdn.net/weixin_46587777/article/details/132368982