第9回「ソウカン」ってなあに?

当初の予定に反して連載が長引くことになった結果として、取り上げるテーマの順番に一貫性がなくなってきました。今回のテーマは本来ならば連載の最初の方で取り上げるべきものです。と、言い訳しつついざ本文へ。 「ソウカン」は「相関・・・

当初の予定に反して連載が長引くことになった結果として、取り上げるテーマの順番に一貫性がなくなってきました。今回のテーマは本来ならば連載の最初の方で取り上げるべきものです。と、言い訳しつついざ本文へ。

「ソウカン」は「相関」と書き、文字どおり「相互の関係」を意味して、「相関がある(ない)」とか「相関係数」といった使い方をします。2つの変量の関係が、身長と体重のように一方が大きければもう一方も大きいような関係を「正の相関がある」といい、逆に緯度と平均気温のように一方が大きくなれば一方が小さくなる関係を「負の相関がある」といいます。これを数値で表現したものが「相関係数」で、マイナス1からプラス1の値を取ります。単に「相関係数」といった場合は「ピアソンの積率相関係数」のことを指し、以下の式で求められます。

ピアソンの積率相関係数式

相当いかつい形をしていますが、分母はデータの数や単位を取り去ってマイナス1からプラス1の間に収めるための仕掛けです。高校で数学をまじめに勉強した方は分母が分子の最大値であることがわかるはずだそうです。(私にゃわかりませんが)

順位相関係数

相関係数の特殊なものにスピアマンの順位相関係数があります。これはデータが順位 であらわされている時に有効な方法です。たとえばプロ野球の順位予想と結果 の相関をもとめて評論家のランク付けをする場合がこれにあたります。式は

スピアマンの順位相関係数式

であらわされますが、これはピアソンの相関係数の式にxとyがともに1からnまでの自然数(1から始まる正の整数)という条件を与えることで導き出されるものです。すなわちスピアマンの順位 相関係数はピアソンの積率相関係数で代用できるということで、特にこの算出方を覚えておく必要はないということです。

万能ではない相関係数

データが順序尺度であれ間隔尺度であれピアソンの相関係数で変量 間の関係の強さ弱さを表現できることがわかりました。ではマーケティングリサーチで最も多用される名義尺度が入った場合はどうでしょう。名義尺度の中でも最も好き~最も嫌いの5段階評価のようなデータは一定の線形性が仮定できますから、順序尺度とみなして相関係数で表現してもかまいません。しかし男女とか職業のように完全な名義尺度となると相関係数は役に立ちません。こういう場合に役に立つのが前号(第8回)で紹介したカイ2乗統計量 です。こんな形でした。

カイ2乗値の数式

これで関連の強さを表現できるのですが、この統計量の欠点は大きければ大きいほど関連が強いのはいいのですが、自由度の違うもの比較する時に安易に「どちらが強い」といえない点にあります。相関係数のように全てが最大値1であれば比較が容易なのに全く残念です。

クラマーの関連係数

この欠点を克服するためにカイ2乗統計量をそれがとりうる最大値で除したものをクラマー(またはクラメール)の関連係数といいます。相関係数と同じようにするために平方に開くのが普通 ですが、相関係数と違って負の値を取ることがありません。順序尺度や間隔尺度のクロス表から得たクラマーの係数の場合、それを正とみるか負とみるかは分析者の技量 に関わる問題です。注意しましょう。

相関係数の解釈

相関係数を算出してみたが、思っていたより高いとか低すぎるといったことがよくあります。特に近年ではパソコンで即座に算出できるので、闇雲にやってしまってこんな悩みにぶつかることが多いのでしょう。これは主に次のような場合が多いのです。

● いくつかの層に分解して分析すべきものを一緒くたにしてしまった。

● 本来加えるべきデータを削除して算出した。 たかが相関係数と思ってデータの吟味を怠ると、その後の分析がすべてパーということにもなりかねませんので注意しましょう。下にあげたのは相関係数のかなり高かった脳血管疾患死亡率と食塩摂取量 のプロット
図です。この程度が相関0.67となる分布です、参考まで。

参考文献『多変量解析のはなし』
大村 平 日科技連

相関係数算出例
相関係数のプロット図

ご調査の相談や見積もりのお問い合わせ、資料請求がございましたらお気軽にご連絡ください。

お電話でのお問い合わせはこちら

受付時間:平日 10:00~18:00

0120-958-603

お電話でのお問い合わせはこちら

受付時間:平日 10:00~18:00

0120-958-603
相関-統計学について。R&D(リサーチ・アンド・ディベロプメント)は生活者インサイトに強い市場調査会社。お客様の課題に最適なリサーチをご提案。会場調査・ホームユース等の定量調査からグループ・インタビュー等定性調査まで幅広い手法に対応できることが強みです。