DATA-SCIENCE
【連載】記述的多変量解析 – 因子分析(斜交回転)
記述的多変量解析4.因子分析(斜交回転)
はじめに
軸の直交を前提とせずに軸を回転します。通常は軸が直交しないので、散布図は書けません。
因子は直交を前提としない
ここでは、プロマックス回転について触れます。プロマックスとは、「プロ」クラステス+バリ「マックス」なのですが、大した意味もないので特に触れません。
さて、斜交回転と言っても、直交回転した行列をもとにしています。一部ソフト(SPSS)では「カッパ」と称していますが(典拠不明)、直交(バリマックス)回転した解を、「何乗か」した解を目標行列として回転します。「何乗か」は、3(SAS)ないし4(SPSS)が使われる(正負の符号はそのまま、絶対値だけ3乗ないし4乗して、もとの符号を戻した値の行列がターゲット行列に使われる)ことが多いようです。
直交の因子負荷行列を数乗かし、極端にした行列をターゲット(目標)にして、回転をします。この際、各軸は直交することを条件とはしません。
こうすると、因子負荷量についても、直交回転とは違った事情が生じます。「因子パタン」と「因子構造」の二通りの値が出ます。基本的に、「因子パタン」を見ましょう。因子負荷量と同じように見ます。「因子構造」は通常は気にすることもないと思います。
ここで「因子パタン」と「因子構造」について見ておきます。図表1.を参照してください。まず、軸は斜交しています。軸と平行に目盛りを読むと因子パタン、軸に垂直におろした足を読むと因子構造です。
仮に軸が直交している場合を考えてみましょう。「因子パタン」と「因子構造」は一致します。これが直交解の因子負荷量です。
基本的には「因子パタン」の単純構造化を目指して回転がなされます。

図表1.因子パタンと因子構造
直交か斜交か
斜交因子分析では、直交解を求めてから、それをもとに解を求めています。つまり、計算量は斜交回転のほうが多くなります。(計算機(コンピュータ)の性能が高くなった)いまは、(極端にデータ量が多いときは別ですが)あまり計算量を気にすることなく、複雑な計算も行います。
考えてみると、因子が必ず「直交している」というほうが不自然です。計算量をあまり気にしないで良い今、基本的には因子分析では斜交解を求めるほうが自然かと思います。なお、斜交解を求めてみたら、「因子間相関」もチェックしておきましょう。
因子分析(斜交解)の計算手続
直交回転と違うのは、因子負荷量(直交解)が、斜交解のそれ(因子パタン行列、因子構造行列、因子間相関行列)で置き換わる点だけです。
ここでは、「因子パタン行列」(と「軸の寄与」)「因子構造行列」「因子間相関行列」だけ触れておきます。
・「因子パタン行列」
各因子の軸に平行に読んだ値です(図表1.参照)。直交回転で因子負荷量を見るような感覚で見るのは(通常)こちら。なお、「説明された分散の合計」として、因子ごとの分散の合計が出力されるかもしれません。これは直交回転の場合の「寄与」に対応する値です。斜交解の場合、因子ごとにパタン行列の値の平方を合計しても、因子間に相関があると、同じ値は求まりません。
・「因子構造行列」
斜交する因子におろした垂線の足を読んだ値です(図表1.参照)。通常は、因子パタンを単純構造化するように回転を行うので、多くの場合、こちらには注目しません。通常、各対象者の因子得点を計算する場合に使用します。
・「因子間相関行列」
各因子間の相関をあらわした行列です。あまり因子間相関が高い場合は、ひょっとしたら、それらの因子は分ける必要は無いかもしれません(意味内容が異なる場合は、因子間相関が高くても、それぞれ別の因子として見る必要があるかも知れません)。
解釈
ここでは、比較のため、先(第3回)の直交回転で得た4因子と同じデータを、斜交回転して、4因子を抽出した結果を見てみましょう。
まず因子パタン(図表2.)を見てみましょう。どうやら、直交解と同様のようです。

図表2.因子パタン行列
ただ因子分析として見るならば、直交解の場合と同様、
第1因子:目立ちたがり
第2因子:内気
第3因子:タフさ
第4因子:なかま意識
と解釈して、概ね終わりです。ただし、因子間の相関を見ておいたほうが良いでしょう。
そのまえに図表2.には、因子寄与も、各項目の共通性や独立性もありません。これは、因子間に相関があるためで(なので、散布図も書けません)、この表からは求められません。試しに、寄与を見てみましょう。単純に平方和を合計しても一致しないと思います。

図表3.説明された分散の合計
あらためて、因子間相関を見てみます。

図表4.因子間相関係数行列
第4因子は他とあまり相関が無いようですが、1、2、3因子は、互いにある程度の相関を持っているようです。
仮にこの関係をさらに拡げて考えていく場合(SEMなど。それに限らず、拡げて解釈する場合)、この因子間の関係は、意識して把握しておく必要があるでしょう。
著者について
出口慎二(でぐちしんじ)
1972年生まれ。1997年、統計分析サービスを行う会社に入社。調査データの入力・集計から多変量解析による分析、関連するプログラミング業務などに携わる。退社後、2001年以降、個人でデータ分析事業を行なう。
2003〜2004年、IRJ(インターネットリサーチ研究会)にて会員社合同の実験調査プロジェクトの統括ディレクターを務める。
2004年、『自分でできるネットリサーチ』を3人共著で上梓。
2005年〜2007年、インフォプラント(現、マクロミル(2007年9月〜2010年7月はヤフー・バリュー・インサイト))に在籍してRQI(ResearchQualityInstitute)を設立し主任研究員を務める。
2005年〜2007年度、サーベイ・メソドロジー研究会(日本行動計量学会の研究部会のひとつ)に参加、インターネットリサーチを含むデータ収集法の研究に携わる。
現在は現場におけるデータ分析業務に重きを置いています。
この記事をシェアする