新シリーズ第4回「質問紙調査と統計学」

統計学の初心者が引っ掛かりそうな罠や、普通の実務書にはあまり書かれていないコツをとりあげる新シリーズ。
今回は、統計学の歴史をたどり、フィッシャーの統計学と、それが今日の質問紙調査のあり方をどう定めたかをお話しします。

やさしい統計学講座 ~教えて朝野先生~

R&D技術顧問 朝野熙彦(中央大学)

第4回 質問紙調査と統計学

Q.私はクライエントと打ち合わせながら調査計画と質問紙の設計をしています。集計分析はデータが集まってからの仕事なので、私たちは統計学を知らなくていいのではないでしょうか。それから前回は仮説検定を誤解している実務家がいるという話がありましたが、学問と実務はもともと関係ないと思うのですが。

A.(朝野先生) それでは統計理論と実務の関係について統計学の歴史をたどってみましょう。統計学にもいろいろな学派がありますので、今回はフィッシャーの統計学と、それが今日の質問紙調査のあり方をどう定めたかについてお話ししましょう。

■フィッシャーが取り組んだ実務

 R.A.フィッシャーは近代統計学の開祖というべき20世紀最大の統計学者です。精密標本論、有意性検定、実験計画法そして最尤法の普及などフィッシャーの業績はとても広範にわたります。
 ところでフィッシャーの略歴ですが、彼がロンドン北部のロザムステッド農事試験所に職を得たのが1919年で29歳の時でした。求人の理由は同試験所がそれまで75年にわたって蓄積してきた膨大な収量(収穫量のこと)データを解析させるためでした。今日でいうデータマイニングの仕事ですね。フィッシャーは農事試験所で働いた1920年代に研究の大部分を完成させています。
 ロザムステッドでの具体的な業務は、顧客企業である化学肥料メーカーが持ち込んできた新製品をジャガイモや小麦などに使い、収量を従来品と比較する仕事でした。皆さんがよくしている新製品の試用テストと同じですね。
 さて単位当たりの収量をY、肥料の違いをX、収穫に影響するその他の要因をZとして、変数の関係を図式化すると図1のようになります。本当はXの違いによるYの変化だけを測定したいのですが、農産物の収穫にはX以外の余分な変数が関係してきます。たとえばZの一つである地力というのは土壌の肥沃度をさします。一つの畑なのに場所によって作物の育ち方が違う、という現象がおきます。
 さて、この課題に対してフィッシャーが出した答えが実験計画法でした。反復測定、無作為化、局所管理をフィッシャーの3原則といいます。

FO-new04_01

たとえば表1は圃場を6ブロックに分け各ブロックを4プロットに分割して肥料A,B,C,Dを割り付けた実験計画法の一例です。これは乱塊法(Randomized block design)と呼ばれるものです。

表1 実験計画法の例
A D B C C A
C B A D D B
C D B D C D
B A A C A B

 圃場に種をまき表1に従って施肥するなら、個々の種にとっては自分がどの肥料を与えられるかはランダムに決まります。これがXを無作為化する意味です。局所管理は、ブロックⅠ~Ⅵの中ではZにかかわる変数は同一の値になるようにコントロールして、ZYに与える影響を相殺することです。肥料A~Dはそれぞれ6カ所ずつ施肥されるのでそれが反復測定になります。24プロットでの収量データYをこれもフィッシャーが開発した分散分析で分析すれば肥料の効果が検定できます。

■歴史認識が大切

 さて農事試験までは分かったとして、フィッシャーの統計学がどうして質問紙調査の理論的な基礎になってしまったのかといういきさつをたどりましょう。農事試験のための統計的方法を工業製品に適用して仮説検定論を提唱したのがフィッシャーの弟子筋にあたるネイマンとピアソンでした。図2をご覧ください。ここでは無作為割り付けが工業製品の抜き取り検査に変わっています。両者は厳密にいえば異なるのですが、母集団から無作為に得た標本をもとに統計的推測を行うという枠組みは同じです。さらに小麦やネジを人間に置き換えて世論調査に応用したのがジョージ・ギャラップでありW.E.デミングでした。デミングはシューハートにQCを習っていますので、工業分野から世論調査に標本抽出を橋渡しした一人でもありました。そしてフィッシャー統計学の流れをくむデミングが戦後の日本に渡って、QC活動と世論調査の指導にあたったというのが、歴史の偶然だといえましょう。こうして標本調査こそが先進的で科学的な方法だとして、日本人に教育されてしまったのです。

FO-new04_02

 さて日本では1960年代から、標本理論をマーケティング・リサーチに転用するようになって今日に至っています。小麦やネジで成功したからといって、同じ理屈を消費者に適用していいのか?という疑問が出て当然ですが、その当時は特に問題視されることもなく、標本理論をマーケティング・リサーチに適用してしまったようです。

■フィッシャーの統計学と質問紙調査

 では今日の質問紙調査の方法論は、フィッシャーの3原則をどのように取り入れて出来ているのでしょうか。
 ①反復測定:これはサンプル数を確保することによって母集団の推定がより正確になる、ということに対応します。標本調査では反復測定⇒サンプル数という翻訳が行われたのです。
 ②無作為化:本質的な問題は、同一の確率分布に従う母集団から標本データが発生するという仮定が満たされているかどうかです。この仮定が正しいかどうかは、市場構造とマーケティング課題によりけりでしょう。より外見的な問題をいえば、調査者側が無作為に選んだ対象者がみな回答してくれるかです。従業員調査や学生調査なら実現できそうですが、そうはいかない場合もあるでしょう。
 ③局所管理:これは余分変数の混入を除去するか一定にコントロールすることに表れています。質問紙調査で質問の順序を決め、質問文を決め、回答法も制約するのはそのためです。CLTや集団一斉の集合調査においては調査員の説明をころころ変えないように管理しています。図1でいえば、対象者条件Zを一定に制約すると同時にXYの測定尺度を標準化するという工夫がされています。このようにフィッシャーの実験計画は、今日の質問紙調査のあり様を規定しているのです。それに対してデプスインタビューやゲーミフィケーションの調査はフィッシャーの3原則とは論理が異なります。しかしそれらの調査がどういう論理からできているのかはまだ明確にされていないように思います。

■フィッシャーが出来なかったこと

 フィッシャーはその功績を語られることが多い人ですが、逆にその限界や彼が何をしなかったかについてはあまり語られないので、ここでは2点だけ指摘しておきましょう。
 1)フィッシャーはデータマイニングのために雇われたはずですが、既存データの解析の方は結局放棄してしまいました。コントロールされていない雑多なデータはいくら膨大にあっても意思決定には使えない。実験計画にそってきちんとしたデータを取得しなければ情報価値がない、というのがフィッシャーの出した結論だったのです。ビッグデータがあふれる今日、私たちはフィッシャーの結論の意味をしっかり考える必要があるでしょう。

 2)図1の主要部分を線形モデルで書くとFO-new04_05となり回帰分析と一致します。ここで、FO-new04_06は確率的に変動する誤差項なので収量Yも確率的に変動する、というのがフィッシャーのモデルでした。では結果のYが確率的に変動するのに原因のXが定数なのはなぜでしょうか。Xに変動や測定誤差がないとした理由は、それが実験者による処置だったからです。肥料を撒くのは自分だ、自分がすることに間違いはないという理屈です。こうして回帰分析の誤差は図3の縦軸方向だけで測られることになったのです。FO-new04_06の二乗和を最小にするようにパラメータを推定するのが最小二乗法でした。
 近年注目されているマルチレベルモデルは原因系にも変動が含まれるものです。そもそも図1のFO-new04_04は固定効果と変量効果が混在する混合モデルでした。Xが消費者意識だったとしたら、Xは当然変動もするし測定誤差もあるでしょうね。ここにフィッシャーのモデリングの限界があります。

FO-new04_03

【今回のまとめ】

  • フィッシャーの統計理論は実務の目的と場面にあわせて開発された
  • 統計学の役割はデータ分析だけでなく調査計画の立案にまで及ぶ
  • 標準化された質問紙とフィールド管理が標本調査の基盤である

《朝野煕彦教授 プロフィール》

1969年 千葉大学文理学部卒業後、マーケティング・リサーチ実務を経て、1980年埼玉大学大学院修了。筑波大学特別研究員、専修大学教授、東京都立大学、首都大学東京教授を歴任。現在、中央大学客員教授、日本行動計量学会理事。「マーケティング・リサーチ プロになるための7つのヒント」「入門 多変量解析の実際」「ビッグデータの使い方・活かし方」「アンケート調査入門」「マーケティング・サイエンスのトップランナーたち」など著書多数。
株式会社リサーチ・アンド・ディベロプメント技術顧問。

朝野煕彦

ご調査の相談や見積もりのお問い合わせ、資料請求がございましたらお気軽にご連絡ください。

お電話でのお問い合わせはこちら

受付時間:平日 10:00~18:00

0120-958-603

お電話でのお問い合わせはこちら

受付時間:平日 10:00~18:00

0120-958-603
株式会社R&D(リサーチ・アンド・ディベロプメント)