序文
ゲノムワイド関連解析データ(GWAS)の原則について、多くのオンラインがあります。
これは私がそんなにGWASソフトウェアのチュートリアルを書いたものですが、理由のGWAS・コンピューティングの原則を書かれたことはありません。
誰かがGWASの算出原理についてブロギングの質問に書くことができる前にかわいいが起こります。私は躊躇なく同意しました。
バックは怠惰な、正当化することはできません書いていない、書きたいのですが、約束どおりのはないと思うとなっています。
あなたはGWAS解析に関するご質問や疑問を持っている場合、私はあなたが私を伝えることができ、私は私が書くことを願って、これらの言葉の意味を記述します。
私は皆を助けるために書かれた、貴重な考慮すれば、それが書き込まれます。
GWAS関与式:最小二乗
最小二乗法:まずは、知識のポイントを確認しましょう。
に精通していない調理、図を参照してください!
このソリューション私たちは中学校の数学です多くの時間。
出典:http://kitsprout.blogspot.com/2015/11/algorithm-least-squares.html
Y = AX + B:式は、のように書くことができます。
Y:私たちは、表現型を研究しました
X:遺伝子型データは、SNPごとと称します
A:SNP係数
B:残差、環境変数であってもよいし、表現型に影響を与える因子またはSNPに加えて、
どの式にセット詠唱の私たちに例、う
示されるように、SNPは、呼び出さrs123があることが想定される:T> C
我々は、Cサイトなどの危険を定義例えば、加法モデルに、C = 1、T = 0
そして、CC = 2、CT = 1、TT = 0
上記式によれば:
値xに対応するSNPは、次のとおり2,2,1,2,1,1,0,2
、対応する表現型は10,7,6,8,5,4,2,6 yは
Y = AX + B:私たちは、前述の式を想起
今、私たちは持っています:
10 = 2A + B
7 = 2A + B
6 = 1A + B
8 = 2A + B
5 = 1A + B
4 = 1A + B
2 = 0 + B
6 = 2A + B
それを変換する、それがこれです:
2A + B - 10 = 0
2A + B - = 0 7
図1A + B - = 0 6
2A + B - = 0 8
図1A + B - = 0 5
図1A + B - = 0 4
0 + B 0 = -2
2A + B = 0 -6
私たちの仕事は、そのような権利、Bを見つけることです
(2A + B - 10)^ 2 +(2A + B - 7)^ 2 +(1A + B - 6)^ 2 +(2A + B - 8)^ 2 +(1A + B - 5)^ 2 + (1A + B - 4)^ 2 +(0 + B -2)^ 2 +(2A + B -6)^ 2最小。
、bは関心のある記事を参照して、誘導された最小二乗法の評価に関する:https://zhuanlan.zhihu.com/p/53556591
式であります:
B = COR(Y、X)* SD(Y)/ SD(X)
A =(10 + 7 + 6 + 8 + 5 + 4 + 2 + 6)/ 8 - ((2 + 2 + 1 + 2 + 1 + 1 + 0 + 2)/ 8)* B
COR(Y、x)は、xとyの相関係数を表します。
SD(Y)、SD(x)は、xとyは標準との間の差を表します
彼らは、R言語を利用することができ、自分の手で数えることができます。
x=c(2,2,1,2,1,1,0,2)
y=c(10,7,6,8,5,4,2,6)
Ex=mean(x);Ex
Ey=mean(y);Ey
Sx=sd(x);Sx
Sy=sd(y);Sy
corn=cor(y,x) ; corn
b=corn*Sy/Sx ; b
a=Ey-b*Ex ; a
最終結果をフィッティングすることである:Aは2.8387に最適化され、Bは2.0968に最適化され、式Y = * X + 2.0968 2.8387
LM関数Rは、すべて私たち自身のマニュアル1つの導出することなく、言語およびBで計算することができます。LMインターセプト値bの結果は、xの値は概算値である行に対応する、関数であります
ベータ(OR)値は、当社のゲノムワイド関連解析、に戻ります
だから、徹底的にどのようにまだ来てされたゲノムワイド関連解析の価値を理解し、これは、その計算の原則であります
その他の変数を
式は、単に上記の遺伝子型と表現型との間の相関を計算します。
私たちが計算した場合、実際には、そのようなので、上の性別、年齢、歪みやなどの他の変数を、参加します。
これらの要因はまた、表現型の変数に影響を与えます。
Y = AX +zβ+ B:他の変数の存在を考慮するとこのように、わずかに式を変更します
Y:私たちは、表現型を研究しました
X:遺伝子型データは、SNPごとと称します
A:SNP係数
Z:年齢、性別、その他の要因
β:年齢、性別などの係数要因
B:残留、加えて、我々は表現型に影響を与える可能性があるSNP、年齢、性別、その他の要因やその他の要因が含まれていました。
上記の計算の原則。