人のピッチと年齢の関係の研究など、線形モデルに精通しています
ピッチ〜年齢+ e
ここで、ageは固定効果(Fixed Effect)であり、eは誤差項であり、結果を制御できないいくつかのランダムな要因の実際の値と予測値の間の偏差を表します。これをモデルの確率的またはランダムな部分と呼ぶこともできます。
別の例として、ピッチと礼儀正しさの関係を調べるために、次の線形モデルを使用して表現できます。
ピッチ〜礼儀正しさ+ e
性別もピッチに影響を与える可能性があると考える場合は、固定効果として性別をモデルに追加することもできます。
ピッチ〜礼儀正しさ+性別+ e
これまでのところ、すべてがよく理解されているようです。しかし、実験的な設計の問題を考えると、これは少し複雑です。個人ごとに、礼儀正しさのレベルごとに異なるピッチレベルが測定されます。つまり、個人の観測データは互いに独立しておらず、各個人の要因も従属変数に影響を与えます。この場合、モデルにランダム効果(ランダム効果)を追加する必要があります。現時点では、ランダム効果により、個人ごとに異なる「ベースライン値」を追加して、実験結果に対する個々の要因の影響のバランスをとることができます。たとえば、個人1の平均ピッチは233 Hzですが、個人2の平均ピッチは210Hzです。アイコンは次のとおりです。
その中で、F1-F9は女性の個人であり、M1-M7は男性の個人です。男性の方が女性よりもピッチがはるかに低いことがはっきりとわかります。同時に、同じ性別でも個人差が大きいこともわかります。このような個人間の違いについては、異なるランダムインターセプト(ランダムインターセプト)を使用できます。つまり、各個人は異なるインターセプト値を持ちます。
したがって、ここでは、混合効果モデルの「混合」という言葉がなぜ意味するのかを理解できます。私たちが通常使用する単純な線形モデルは、実際には固定効果のみを含むモデルです。誤差項eを使用して、別の制御できない要因の影響を表します。ただし、実際には、上記の例のように、個々の要因の影響を考慮する必要がある誤差項eにはまだいくつかの要因があります。このとき、誤差項eの一部を取り出して、ランダム効果の一部としてモデルに追加し、「固定効果」と「ランダム効果」の両方を含む混合効果モデルを形成することができます。
個々の要素が追加されたので、モデルは次のように表すことができます。
ピッチ〜ポライトネス+性別+(1 |件名)+ e
その中で、(1 | subject)は、R言語でランダムな効果を表現するために一般的に使用される方法であり、「すべての個人が異なる切片を持っていると仮定する」ことを意味します。「1」は切片を意味し、モデルにそれぞれ個人には複数の従属変数応答値があり、これらの応答値は個人のベースラインレベル(つまりインターセプト)の影響を受けます。もちろん、このモデルには、避けられない誤差項eがまだあります。すべてのランダムな要因を考慮に入れることはできません。誤差項から、いくつかのランダムな要因の影響を取り除こうとします。
以下では、モデルをより複雑にするためにいくつかの要素を追加します。ピッチを決定するために、各個人は、「教師に助けを求める」、「クラスメートに助けを求める」、「遅刻を正当化する」など、7つの異なる項目(項目)の測定を実行しました。これらのさまざまなシーンもピッチに影響します。イラストは以下の通りです。
これらのシーンの平均ピッチレベルの違いは、個々の要因による違いほど大きくはありませんが、それでも違いはあります。モデルでそれらを考慮し、モデルにランダムな効果を追加して、新しいモデルを取得することをお勧めします。
ピッチ〜礼儀正しさ+性別+(1 |件名)+(1 |項目)+ e
このようにして、個人差が結果に与える影響を解決するだけでなく、シーンの違いが結果に与える影響も解決しました。これは、混合効果モデルによってもたらされる便利さです。以前は、このような状況に遭遇したとき、モデル全体の切片項としてすべての個人の平均をとるなど、通常、分析で平均しました。これは間違いではありませんが、多くの情報が失われます。[データ分析では、平均値を使用するように注意してください。平均化すると、多くの変動情報が失われます]。
R言語での混合効果モデルの実現
R- " lme4 "パッケージを使用します。データソースは次のとおりです:
http ://www.bodowinter.com/tutorial/politeness_data.csv
ライブラリ(lme4)
丁寧= read.csv("http://www.bodowinter.com/tutorial/politeness_data.csv" )
ヘッド(丁寧)
#対象性別シナリオ姿勢周波数
#1 F1 F 1、POL 213.3
#2 F1 F 1 inf 204.5
#3 F1 F 2 pol 285.1
#4 F1 F 2 inf
259.7 #5 F1 F 3 pol 203.9
#6 F1 F 3 inf 286.9
その中で、主題は個々の要因を表し、性別は性別の要因を表し、シナリオは7つの異なるテストシナリオを表し、態度は礼儀正しさを表します(polは礼儀正しさを表し、infは失礼を表します)、頻度は従属変数のピッチを表します。
データを分析する前に、まずボックスプロットを描画して、従属変数に対するいくつかの要因の影響を直感的に感じます。
箱ひげ図(頻度〜態度*性別、col = c( "white"、 "lightgray")、data =礼儀正しさ)
礼儀正しいことのピッチは失礼なことのピッチよりも低く、男性は一般的に女性よりも低いピッチを持っていることがわかります。
混合効果モデルを適合させます。
politeness.model <-lmer(頻度〜態度+(1 |件名)+(1 |シナリオ)、データ=礼儀正しさ)
summary(politeness.model)
結果は次のとおりです。
最初に、出力結果から使用しているモデルがわかり、次にAIC、対数尤度推定などのモデルフィッティング効果がわかります。次に、ランダム効果のフィッティング結果があります。
変量効果:グループ名の分散標準偏差 シナリオ( 切片)219 14.80 被験者( 切片)401563.36残差64625.42
3番目の列は、従属変数の変動に対するランダムファクターの影響です。最初のランダムファクター(シナリオ)は、結果の2番目のランダムファクター(サブジェクト)よりも結果への影響が小さく、上記の図と組み合わせると、非常に大きくなります。わかりやすい。最後の項目「残差」は誤差項です。つまり、モデルでは説明できない従属変数の変動があります。
以下は、固定効果フィッティングの結果です。
固定効果: 推定標準 エラーt値 (切片)202.588 26.7547.572 姿勢ポール-19.6955.585 -3.527
その中で、attitudepolは、カテゴリ変数の礼儀正しさの傾きの推定値です。つまり、ピッチは19.695 Hzだけ失礼(inf)から礼儀(pol)に減少します。
では、ここで202.588Hzの勾配はどういう意味ですか?前のボックスプロットを振り返ると、202.588の値は基本的に男性と女性の失礼な(inf)グループの中央にあることがわかります。つまり、失礼な状況の平均値です(上記のモデルの場合)。 、性別の要因は考慮しませんでしたが、男性と女性全体を考慮しました)。以下に性別要素を追加します。
politeness.model = lmer(頻度〜態度+性別+(1 |件名)+(1 |シナリオ)、データ=礼儀正しさ)
summary(politeness.model)
結果は次のとおりです。
このモデルでは、ランダム効果の観点から、従属変数に対する個々の要因の影響が大幅に減少します。これは主に、性別の要因が個々の要因から分離され、個々の要因の影響が小さくなるためです。
固定効果の場合、丁寧さの影響は基本的に前モデルと同じですが、従属変数には性別の影響が大きく、男性の方が女性よりもピッチが108Hz低くなっています。このとき、解像度も大きくなり、女性の失礼の平均的なトーンレベルを表しています。
モデル比較とP値推定
残念ながら、上記のモデルの結果では、各変更のp値は示されていません。ここでは、主に尤度推定によるP値の計算を紹介します。可能性の比率は、2つのモデルを比較することです。1つは関心のある研究要因を含み、もう1つは要因を含みません。2つのモデルを比較することにより、モデルにおける要因の役割を判断できます。たとえば、歩行速度に影響を与える要因を調べたい場合は、最初に携帯している懐中電灯を捨てて、前後で歩行速度があまり変わらないことを確認します。次に、携帯している水の入ったバケツを捨てると、歩行速度が明らかに速いことがわかります。水の入ったバケツはあなたの歩行速度に大きな影響を与える可能性があると言えます。
詩1:ハイキング速度〜水ガロン+懐中電灯 写真2:ハイキング速度〜懐中電灯
モデル1は、すべての研究要素を含む完全なモデルであり、2番目は、一部の研究要素のみを含む単純化されたモデルです。2つのモデルを比較することにより、モデルにおける1ガロンの水の役割が重要であるかどうかを判断できます。
前の例を組み合わせて、ピッチの丁寧さの効果を判断しましょう。まず、礼儀正しさを除いた簡略化されたモデルを作成し、次にすべての要素を含む完全なモデルを作成します。
politeness.null = lmer(頻度〜性別+(1 |件名)+(1 |シナリオ)、データ=礼儀正しさ、REML = FALSE)
politeness.model = lmer(頻度〜態度+性別+(1 |件名)+(1 |シナリオ)、データ=礼儀正しさ、REML = FALSE)
#比较两
TTSposanova(politeness.null、politeness.model)
結果は次のとおりです。
上記の結果から、
「礼儀正しさの程度はスピーチのピッチに影響を与え(chisq = 11.62、p = 0.00065)、礼儀正しいピッチは失礼なピッチより19.7Hz低い(SE = 5.6)」という結論を得ることができます。
注意が必要なもう1つのポイントは、2つの変数間の相互作用の可能性です。たとえば、礼儀正しさの程度は性別自体に影響されますか?2つの異なるモデルを比較して判断することもできます。
フルモデル:頻度〜態度*性別 簡略化モデル:頻度〜態度+性別
R言語では、「*」は相互作用を意味します。2つのモデル間で比較されたp値が統計的に有意である場合、態度と性別の間に相互作用があります。
ランダムインターセプトとランダムスロープ
上記はハイブリッドモデルについて多くの概念を紹介しましたが、まだ終わっていません!以下は、ハイブリッドモデルの最もエキサイティングな部分です。
上記のモデルでは、ランダム効果が固定されていないことがわかります。次の関数でモデルの係数を確認できます。
coef(politeness.model)
結果は次のとおりです。
上記から、固定効果(態度と性別)の場合、係数は固定されていますが、ランダム効果(シナリオと主題)の場合、切片項は異なります。したがって、このモデルは「ランダムインターセプトモデル」とも呼ばれます。
しかし、慎重に考えてください。固定効果の場合、傾斜はすべての個人で同じですが、これは実際の状況に適合していますか?固定効果が異なる(つまり、個人ごとに固定効果の傾きも異なる)個人はいますか?このとき、「ランダムスロープモデル」を検討する必要があります。このモデルは、テストオブジェクトごとに異なる切片で実行されるだけでなく、異なる勾配を持つこともできます。
politeness.model = lmer(頻度〜態度+性別+(1 +態度|主題)+(1 +態度|シナリオ)、
データ=礼儀正しさ、REML = FALSE)
その中で、「(1 + attitude | subject)」は、モデルが各個人(subject)に異なる切片( "1")を使用し、研究変数に異なる勾配( "attitude")を使用することを意味します。この時点でモデル係数を確認してください。
個人(被験者)やシナリオ(シナリオ)ごとに、切片が異なるだけでなく、礼儀正しさ(態度)の係数も異なることがわかります。これは、各個人が失礼なものから礼儀正しいものまで異なるピッチを持っていることを意味します。同様に、ランダムスロープモデルに性別を追加することもできます。同様に、anovaを使用して、完全なモデルと簡略化されたモデルを比較し、変数のP値を取得します。
通常の状況では、通常、混合モデル、つまり「ランダムインターセプトモデル」にランダムインターセプトを追加するだけですが、実際には、上記の例のように、「ランダムスロープモデル」を使用する方が実際の状況と一致します。多くのコンピューターシミュレーション研究では、ランダムスロープが追加されていない場合、混合モデルは通常非常に攻撃的であり、タイプIエラー(誤検知)が高いことが示されています。
最後に、ランダム効果と固定効果をまとめましょう。ランダム効果は、実験を生み出す非体系的で個別の予測不可能な要因ですが、固定効果は、実験に対して体系的で予測的な効果を生み出す要因です。ランダム効果と固定効果の定義もあります。つまり、この要素を使い果たすことができるかどうかです。たとえば、上記の例では、使い果たされた性別は2つしかないため、固定効果です。個人の場合、多くの上記の実験はごく少数の個人であり、すべての個人を使い果たすわけではない可能性があるため、ランダムな効果です。
=====終わり====
出典:www.bodowinter.com/tutorial/bw_LME_tutorial2.pdf