SAS因子分析(因子スコア関数を見つけるための因子プロセスおよび因子回転および回帰法)

以下の表に示されているデータは、ロサンゼルスの 12 の標準大都市統計地域における国勢調査から得られたものです。これには、総人口 ( pop )、住民の教育レベルまたは中等教育の年数 (学校 )、総従業員数 (雇用 )、さまざまなサービス産業の人数 (サービス ) という 5 つの社会経済変数があります。 ) と住宅価格の中央値 ( house  ) について、因子分析を試してください。

5つの社会的要因調査データ

n

ポップ

学校

雇用する

サービス

1

5700

12.8

2500

270

25000

2

1000

10.9

600

10

10000

3

3400

8.8

1000

10

9000

4

3800

13.6

1700

140

25000

5

4000

12.8

1600

140

25000

6

8200

8.3

2600

60

12000

7

1200

11.4

400

10

16000

8

9100

11.5

3300

60

14000

9

9900

12.5

3400

180

18000

10

9600

13.7

3600

390

25000

11

9600

9.6

3300

80

12000

12

9400

11.4

4000

100

13000

実験コード:

proc import out=temp1                                                                                                                  
datafile="D:\1常用桌面文件\IT\SAS实验\实验8\1.xls"                                                                                
DBMS=EXCEL2000 replace;                                                                                                                 
run;
proc factor data=temp1 method=prin priors=one simple corr proportion=0.80 rotate=varimax score n=3 out=test;
var  pop school employ services house;
run;
proc print data=test;
var factor1 factor2 factor3;
run;
proc  plot  data=test;
plot   factor2*factor1  $  n=′*′/
href=0 vref=0;
run;

コード結果の説明:

この方法は主成分であり、主成分法を使用して因子分析を実行します。Priors
=one は、事前共通因子の分散推定値を計算する方法を指定します。両方ともプログラムのデフォルトのパラメーターです。
相関行列を見つけるための corr と、偏相関行列を作成し、
回帰を使用して単純な条件変数スコアを簡単に出力します。因子スコア モデルの係数
比率を推定する方法は、m が λ1+... を満たす最小の正の整数になるように、共通因子の数 m を選択することです。 +λm / p ≥ 0.80。共通
因子の解が見つかりました。初期の因子負荷行列は「単純構造基準」を満たしていません。つまり、各共通因子の典型的な代表変数があまり顕著ではないため、共通因子の解は簡単です。共通因子の意味をあいまいにし、因子の解釈に役立たないため、因子負荷行列を回転および変換して、各因子負荷の 2 乗が次のとおりになるようにする必要があります。構造を単純化する目的を達成するために、因子負荷行列を 0 と 1 の 2 つの極に変換するこの方法は因子回転と呼ばれ、回転変換方法には主に直交回転、斜め回転などが含まれます。

ポップ=0.58096F1+0.80642F2

学校=0.76704F1-0.54476F2

雇用=0.67243F1+0.72605F2

サービス=0.93239F1-0.10431F2

ハウス=0.79116F1-0.55818F2

共通因子で説明できる分散はそれぞれ 2.8733136 と 1.7966601 です。共通因子の分散の最終合計は 4.669974=2.8733136+1.7966601=0.98782629+0.88510555+0.97930583+0.88023562 となります。 +0.93750041。共通因子 F1 の 4 つの変数に対する因子負荷量はすべて正であり、その中でも特にサービス、住宅、学校の変数との相関が大きく、共通因子 F2 の変数雇用に対する因子負荷量は 0.80642 および 0.72605 と大きな正の値となっています。専門的な知識を総合すると、F1 が経済発展要因、F2 が人口要因であると考えられます。さらに分析が必要な場合は、分析用の因子スコア関数を取得するために因子回転が必要です。著者は、ここではローテーション後の分析を実行していません。必要に応じて、読者は独自の実験を行い、上記の方法で分析できます。因子ローテーションは、因子負荷量が平均化された後にのみ実行され、因子分析後の解釈は困難です。目的は、負荷を二極化し、プロセスを促進します。専門的な説明。

 

おすすめ

転載: blog.csdn.net/weixin_56115549/article/details/125029809