以下の表に示されているデータは、ロサンゼルスの 12 の標準大都市統計地域における国勢調査から得られたものです。これには、総人口 ( pop )、住民の教育レベルまたは中等教育の年数 (学校 )、総従業員数 (雇用 )、さまざまなサービス産業の人数 (サービス ) という 5 つの社会経済変数があります。 ) と住宅価格の中央値 ( house ) について、因子分析を試してください。
5つの社会的要因調査データ
n |
ポップ |
学校 |
雇用する |
サービス |
家 |
1 |
5700 |
12.8 |
2500 |
270 |
25000 |
2 |
1000 |
10.9 |
600 |
10 |
10000 |
3 |
3400 |
8.8 |
1000 |
10 |
9000 |
4 |
3800 |
13.6 |
1700 |
140 |
25000 |
5 |
4000 |
12.8 |
1600 |
140 |
25000 |
6 |
8200 |
8.3 |
2600 |
60 |
12000 |
7 |
1200 |
11.4 |
400 |
10 |
16000 |
8 |
9100 |
11.5 |
3300 |
60 |
14000 |
9 |
9900 |
12.5 |
3400 |
180 |
18000 |
10 |
9600 |
13.7 |
3600 |
390 |
25000 |
11 |
9600 |
9.6 |
3300 |
80 |
12000 |
12 |
9400 |
11.4 |
4000 |
100 |
13000 |
実験コード:
proc import out=temp1
datafile="D:\1常用桌面文件\IT\SAS实验\实验8\1.xls"
DBMS=EXCEL2000 replace;
run;
proc factor data=temp1 method=prin priors=one simple corr proportion=0.80 rotate=varimax score n=3 out=test;
var pop school employ services house;
run;
proc print data=test;
var factor1 factor2 factor3;
run;
proc plot data=test;
plot factor2*factor1 $ n=′*′/
href=0 vref=0;
run;
コード結果の説明:
この方法は主成分であり、主成分法を使用して因子分析を実行します。Priors
=one は、事前共通因子の分散推定値を計算する方法を指定します。両方ともプログラムのデフォルトのパラメーターです。
相関行列を見つけるための corr と、偏相関行列を作成し、
回帰を使用して単純な条件変数スコアを簡単に出力します。因子スコア モデルの係数
比率を推定する方法は、m が λ1+... を満たす最小の正の整数になるように、共通因子の数 m を選択することです。 +λm / p ≥ 0.80。共通
因子の解が見つかりました。初期の因子負荷行列は「単純構造基準」を満たしていません。つまり、各共通因子の典型的な代表変数があまり顕著ではないため、共通因子の解は簡単です。共通因子の意味をあいまいにし、因子の解釈に役立たないため、因子負荷行列を回転および変換して、各因子負荷の 2 乗が次のとおりになるようにする必要があります。構造を単純化する目的を達成するために、因子負荷行列を 0 と 1 の 2 つの極に変換するこの方法は因子回転と呼ばれ、回転変換方法には主に直交回転、斜め回転などが含まれます。
ポップ=0.58096F1+0.80642F2
学校=0.76704F1-0.54476F2
雇用=0.67243F1+0.72605F2
サービス=0.93239F1-0.10431F2
ハウス=0.79116F1-0.55818F2
共通因子で説明できる分散はそれぞれ 2.8733136 と 1.7966601 です。共通因子の分散の最終合計は 4.669974=2.8733136+1.7966601=0.98782629+0.88510555+0.97930583+0.88023562 となります。 +0.93750041。共通因子 F1 の 4 つの変数に対する因子負荷量はすべて正であり、その中でも特にサービス、住宅、学校の変数との相関が大きく、共通因子 F2 の変数雇用に対する因子負荷量は 0.80642 および 0.72605 と大きな正の値となっています。専門的な知識を総合すると、F1 が経済発展要因、F2 が人口要因であると考えられます。さらに分析が必要な場合は、分析用の因子スコア関数を取得するために因子回転が必要です。著者は、ここではローテーション後の分析を実行していません。必要に応じて、読者は独自の実験を行い、上記の方法で分析できます。因子ローテーションは、因子負荷量が平均化された後にのみ実行され、因子分析後の解釈は困難です。目的は、負荷を二極化し、プロセスを促進します。専門的な説明。