第4回「回帰分析」ってなぁに?

「回帰分析」…またまた耳慣れない言葉が出てきました。そもそも「回帰」という言葉の意味は? 【回帰】一周してもとへ帰ること。めぐりかえること。くりかえすこと。(広辞苑) …なんだかよくわかりません。英語では 【regres・・・

「回帰分析」…またまた耳慣れない言葉が出てきました。そもそも「回帰」という言葉の意味は?


【回帰】一周してもとへ帰ること。めぐりかえること。くりかえすこと。(広辞苑)

…なんだかよくわかりません。英語では


【regression】あと戻り、復帰;後退、退歩;《生物》退化;《天文》回帰、逆行(研究社新英和中辞典)


そもそもは子供の身長を父親の身長から推定する、言い換えると子供と父親の身長の関係を数式で表現することから、「先祖帰り」といった意味で「regression」という言葉が使われたということをどこかで聞いた覚えがあります。


では、マーケティングの世界ではどのように使われているのでしょうか。マーケティング系の多変量解析の参考書では「販売高をいくつかの変数で予測する」を例に取ることが多いようです。

『経営のための多変量解析法』では「駅前洋菓子チェーン店の販売高を乗降客数、店の間口、取扱品目数で予測する」という例が載っています。回帰分析では予測したい数値(この場合販売高)を基準変数と呼び、残りの3つを説明変数と呼びます。この説明変数が複数ある場合を特に「重回帰分析」といいます。さて、この例のように基準変数、説明変数の全てが数値データである場合でないと、回帰分析は適用できないのでしょうか?


説明変数が「男」、「女」とか、学歴などのカテゴリーデータの場合は使えないのでしょうか?


こういうデータの場合は日本で生まれた「林の数量化Ⅰ類」を使うものだと思い込んでいる人も多くいると思います。上記の本でも「数量化理論Ⅰ類」に1章を別に設けています。しかし読んでみると中身は「重回帰分析」で解いています。この2つの分析法の関係はどうなっているのでしょう。それについては「数量化理論Ⅰ類のまとめ」に次のように述べられています。「質的データをダミー変数で表現することによって、これは回帰分析と同じモデルに帰着する。」質的データとはカテゴリーデータのことですが、「ダミー変数」とはなんのことでしょう。表-1のように3カテゴリーで表現されるひとつの変数を1,0で表現される2つの変数にしたものをダミー変数といいます。さて本当に結果が同じになるのか気になるところです。


この本には実際に数量化理論Ⅰ類で解いた結果が出ていませんので、試してみましょう。


データは前掲書の「数量化理論Ⅰ類」の章に載っている「読書調査」を使います。


結果は表-4のとおり全く同じになりました。


数量化Ⅰ類と重回帰分析の関係は数量化Ⅱ類と判別分析にもあてはまります。応援をいただければ、次回に同じになることを証明します。


参考文献:本多正久・島田一明共著「経営のための多変量解析法」

カテゴリーデータとダミー変数の関係
表1/カテゴリーデータとダミー変数の関係

数量化のためのカテゴリーデータ

表2/数量化のためのカテゴリーデータ

回帰分析のためにダミー変換したデータ

表3/回帰分析のためにダミー変換したデータ

回帰分析と重回帰分析の関係
表4/それぞれの結果のまとめ

ご調査の相談や見積もりのお問い合わせ、資料請求がございましたらお気軽にご連絡ください。

お電話でのお問い合わせはこちら

受付時間:平日 10:00~18:00

0120-958-603

お電話でのお問い合わせはこちら

受付時間:平日 10:00~18:00

0120-958-603
回帰分析-統計学について。R&D(リサーチ・アンド・ディベロプメント)は生活者インサイトに強い市場調査会社。お客様の課題に最適なリサーチをご提案。会場調査・ホームユース等の定量調査からグループ・インタビュー等定性調査まで幅広い手法に対応できることが強みです。