第3回「因子分析」ってなあに?

前回の本欄でちらっと触れましたが、今回はたくさんの変量を少数の変量にまとめ上げる手法の代表選手「因子分析」と「主成分分析」をとりあげます。  この2つは使う目的も、アウトプットされる統計量も似通っているためにと・・・

前回の本欄でちらっと触れましたが、今回はたくさんの変量を少数の変量にまとめ上げる手法の代表選手「因子分析」と「主成分分析」をとりあげます。
 

この2つは使う目的も、アウトプットされる統計量も似通っているためにとかく「同じようなもの」と思われていますが、実際は水と油以上に違うものです。
 

主成分分析は元々の変量を重視して、変量1×ウェイト1+変量2×ウェイト…といった乗積モデルです。いってみれば「基準地価」だの「人口密度」だの「千人当たりの飲食店数」だのの個々の変量をいちいち見るのが面倒なので、かけたり足したりした一つの指標にまとめて都市化指標」とでも名付けてしまえという方法です。できた合成変量を「主成分得点」と呼びます。
 

それに対して因子分析は元々の変量にはあまり重きをおきません。多くの測定可能な変量の裏には測定不可能な「因子」が存在することを仮定し、それを明らかにすることが目的です。なんだかややこしい話ですが、多くの参考書では学科テストや知能テストを例にとって解説されています。私なりに簡略化して書くと、国語、数学、理科それぞれの点数の裏には「読解力」と「計算力」の2つの因子が存在し、それをうまく説明するためには「理科」の点数を分解してしまえばいいという方法です(相当乱暴な要約ですが)。できた合成変量を「因子得点」と呼びます。
 

こうも違う2つの手法を同じ目的で使っていいのでしょうか?どちらか一方を使うのが正しくて、他方は間違いなのでしょうか?実はどちらを使うのも間違いではないのです。では、何らかの基準で使い分けをするべきなのでしょうか?そうしている人もおられるとは思いますが、その基準には根拠がなく実状は分析者の純粋な「好み」が基準になっているのではないかと思います。
 

「そんないい加減では困る。何らかの指針を示せ」といわれるかもしれませんが、それぞれの特徴をふまえて、「分析者の責任で選ぶ」しかありません。そこで特徴をまとめておこうと思います。
 

因子分析で結果が「不定」というのは、解法、軸の回転方法、因子の打ち切り数によって解が変わることを指しています。主成分分析では出発行列が相関行列か分散共分散行列かが一致していれば、成分の打ち切りを2にしようが、5にしようが主成分得点は変わりません。
 

ここからは全くの私見ですが、分析の目的が「クラスタリングを前提とする」ときは主成分分析を使って変量の縮約よりはクラスター分析に注力する。「考え方の構造だけを探る」ときは因子分析を使って因子の打ち切り数をいろいろ変えてやってみる。というのが分析に関わる手間の総量から考えて、いいのではないかと思います。

  因数分析 主成分分析
入力データの変換 相関行列 相関行列、分散共分散行列
主な説明情報 変数間の相関 変数の分散、変数間の共分散
共通性 推定する 概念自体がない
軸の回転 する (一般には)しない
結果の安定性 不定 安定

概念図(多次元空間の2次元を表示)

主成分分析の概念図

関連するサービス

ご調査の相談や見積もりのお問い合わせ、資料請求がございましたらお気軽にご連絡ください。

お電話でのお問い合わせはこちら

受付時間:平日 10:00~18:00

0120-958-603

お電話でのお問い合わせはこちら

受付時間:平日 10:00~18:00

0120-958-603
因子分析-統計学について。R&D(リサーチ・アンド・ディベロプメント)は生活者インサイトに強い市場調査会社。お客様の課題に最適なリサーチをご提案。会場調査・ホームユース等の定量調査からグループ・インタビュー等定性調査まで幅広い手法に対応できることが強みです。