第12回「ヘイキン」ってなあに?

「ばかにするなっ!!!」というお叱りが聞こえてきそうですが、すこし待ってください。 近頃、TVや新聞のマスコミでやたらと「平均がこうだから・・・」といった言い方や書き方が耳についたり目に付きます。別に今になって始まったこ・・・

「ばかにするなっ!!!」というお叱りが聞こえてきそうですが、すこし待ってください。
近頃、TVや新聞のマスコミでやたらと「平均がこうだから・・・」といった言い方や書き方が耳についたり目に付きます。別に今になって始まったことではないし、平均値をものさしに使うことが間違っているわけでもありません。危ういのは「平均」だけでデータの特性の全てがわかった気になることです。それによってとんでもない判断ミスを犯すかもしれないということを知らないことです。そんなわけで、今回は初心に立ち返り「データを見る眼」に磨きをかけてもらいたいと思います。

平均月収が47万円の会社

と聞いてどう思いますか?「そんなに給料のいい会社ならば入ってみたい」と思うでしょうか。
「年配の社員ばかりで将来がないに違いない」と思って入社は躊躇するでしょうか。この会社には若い人がたくさんいるという情報が追加されたらどうでしょうか。「ひょっとして社長や専務の報酬まで加算されているんじゃないか?」
はい、正解です。実際にはこんな風になっています。

平均値を導く月収データ

平均より多くもらっている人は4人(5分の1)しかいません。
平均の半分以下の人が10人(2分の1)もいます。平均ピッタリの人は1人もいません。47万円という数値がこのデータを要約する代表値としてふさわしいでしょうか。ふさわしくないとしたら、なぜ世間では「平均」(正しくは算術平均)がもてはやされるのでしょうか。

様々な代表値

算術平均には算出が容易であるという最大の美点のほかにも、「ヒストグラム(頻度の棒グラフ:文末に掲載)の重心を意味する」性質があり、この2点が算術平均が多用される理由だろうと思います。
しかし算術平均だけをデータ要約の代表値として用いることの危険性は統計が始まったときから認識されていました。そこで、いろいろな平均値や分布を要約する数値が提唱されてきました。どんなものがあるかまとめてみましょう。

代表値一覧

表の右端の数字が今回呈示したデータでのそれぞれの値です。
「幾何平均」の「データ数で開く」というのは「n乗根をとる」という意味で、このデータは20人のデータなので20乗根ということになります。なかなか優れた代表値なのですが、計算の面倒さのせいでほとんど使われていません。現在はパソコンという便利な道具がありますから、見直されてもいいと思います。「調和平均」欄にある「逆数」は○分の1のことで、10の逆数は10分の1で0.1です。「調整平均」はフィギュアスケートの採点等に用いられていますが、一定割合の大きなデータ、小さなデータを除外した代表値です。この場合は0.2ですので上下2人ずつ、計4人を除外した平均値です。さて、どの数値がこのデータを最もよく表現していると思いますか?
 

月収の5数要約値(最大値/第3四分位/第1四分位/中央地/最小値)

分布の形を表現する値

ここまで述べてきた代表値はいずれも一点を表現する値でした。よって、この6個の数値をいくらにらんでも、もとのデータがどのように分布しているかを想像が出来ません。これを(ある程度)可能にするのが、「5数要約」です。文字どおり5組の数値で分布を表現するもので、最小値、第1四分位、中央値、第3四分位、最大値で構成されます。第1四分位はデータを小さい方から並べた(データの数の)4分の1番目のデータのことです。第2四分位がないのは「中央値」と表現されているからです。これなら少しは想像がつくでしょう?

視覚にはかなわない

ここまで読んでいただいた方には申し訳ないですが、どんなに工夫して算出した統計値も数値は数字。視覚的理解には遠く及びません。図1「箱ひげ図」と呼ばれるもので、5数要約値をグラフにしたもので、5本の横線それぞれが5数要約値を表しています。統計的には優れた「箱ひげ図」ですが、一般人にはわかりにくいですね。
最終兵器はこれ。(図2)「え~ただの棒グラフ?」そうなんです。でもこのグラフは意図的かどうかは別にして、情報が欠落しています。正しくはこう。(図3)

結局、人間の優れた視覚に直接訴えるグラフが、データの持つ情報を最も過不足なく表現できる手段なのです。
この手段をあえて用いず、「平均は」、「○○の平均と比べて」を連発する論者や記事は「何かを意図的に隠そう」としているのかもしれません。ご注意あれ。

5数要約値をグラフにした箱ひげ図
月収×社員人数の棒グラフ1(最上部の数表をそのままグラフ化した誤ったグラフ)
月収×社員人数の棒グラフ2(最上部の数表を正しくグラフ化したもの)

ご調査の相談や見積もりのお問い合わせ、資料請求がございましたらお気軽にご連絡ください。

お電話でのお問い合わせはこちら

受付時間:平日 10:00~18:00

0120-958-603

お電話でのお問い合わせはこちら

受付時間:平日 10:00~18:00

0120-958-603
平均-統計学について。R&D(リサーチ・アンド・ディベロプメント)は生活者インサイトに強い市場調査会社。お客様の課題に最適なリサーチをご提案。会場調査・ホームユース等の定量調査からグループ・インタビュー等定性調査まで幅広い手法に対応できることが強みです。