#13 意外と知らない?!サンプル数の正しい考え方

research_column_13top

サンプリング

市場調査を実施する際に、母集団(調査対象全体)の全員に対して調査をおこなうことができれば、完璧なデータが導き出せます。ですが、物理的に全員調査はほぼ不可能なため、一般的に母集団の一部を抽出して「標本調査」がおこなわれます。

抽出にあたっては、調査対象者が母集団の特性をできるだけ忠実に反映するように選び出すことが必要です。その選び方を「サンプリング」と呼びます。プロモーションで試供品を多くの人に配布する「サンプリング」とは異なるので誤解のないようにしてください。

サンプリングは、ためしサンプル数、つまり調査する人数が少ないと、誤差が大きくなり、母集団を代表する調査結果を得ることができなくなってしまいます。一方、サンプル数を多くすればするほど誤差は小さくなり、より正確な調査結果を得ることができるようになりますが、その分費用がかさんでしまいます。(厳密にはサンプリング精度など他の要素も影響しますが、大まかにはこのように言えます)

では、費用をなるべく抑えながら、できるだけ正確な調査結果を手に入れるためには、いったいどのくらいの数のサンプルを集める必要があるのでしょうか?

サンプル数決定のポイントは?

母集団(調査対象全体)とサンプルの間には、どうしてもサンプリング誤差が発生します。その誤差の許容範囲を考慮しながら、サンプル数を決定するという考え方が一般的です。調査したい母集団に対して、標本数が多ければ多いほど誤差は少なくなるので、サンプル数は多いに越したことはないのですが、調査にかけられる予算は青天井というわけにはいかないのが現実です。ですから、「予算に応じて誤差をどこまで許容するか」を最優先してサンプル数を決定しましょう。

参考になるのはサンプリング誤差早見表です。これは、単純無作為抽出で「サンプルを○○件とり、その結果○○%の回答が得られた場合にプラス・マイナス何%の誤差があるか」をあらわしたものです。たとえば、ある商品・サービスを好きと答えた人が50%で、サンプル数が100ならば、誤差は±10%だということがわかります。誤差が±10%ということは、これを母集団に当てはめたときに、40%から60%の間に正しい値があるとみなされるということです。サンプリング誤差早見表は、Webでも簡単に見つけることができますので、一度ご覧ください。

推定精度に基づくサンプル数

さらに精度を2倍に、つまり誤差が±5%以内に収まるようにしたければ、サンプル数は4倍の400にする必要があります。これは、以下の式によって求められます。

必要なサンプル数=1÷許容誤差の2乗

つまり、許容誤差±5パーセントの場合は、1÷(0.05×0.05)=400 です。逆に精度が半分の±20%以内でよければ、1÷(0.2×0.2 )=25 となるので、サンプル数は25で済んでしまいます。

では、許容誤差±2パーセントになるとどうでしょう? 1÷(0.02×0.02)=2500 つまり、必要サンプル数は2500まで跳ね上がります。誤差を小さくしようとすると、サンプル数を増やす必要があることがハッキリとします。

出現確率によって決める

商品・サービスを購入したことがある人に、その商品・サービスに関する市場調査をおこないたい場合、もし購入経験者のリストがあればそのリストから選ぶことができますが、サンプルの中から購入経験者を選び出さなければならない場合、出現確率からサンプル数を決定することになります。

仮に、その商品・サービスを購入したことがある人が全人口の10パーセントだとします。その商品・サービスを購入したことがある人100人に対して、その商品・サービスに関する市場調査をおこないたい場合、何人のサンプルを集めなければならないかというと、100人÷0.1=1000人です。

つまり1000人サンプルを集めれば、そのうちの10パーセント=100人、の購入経験者を集めることができます。

実績から決める

これまでの市場調査の実績上、1地域のサンプル数が500あれば、さまざまな分析をおこなうことが可能であるといわれています。また、性別・年齢別の分析をおこなう場合には、1属性についてサンプル数が最低30必要であるといわれています。たとえば、男女別で10代から50代までの10属性でクロス集計をおこなう場合、必要なサンプル数は300ということになります。

サンプル数の決定にあたっては、計算がやや面倒な側面もありますが、予算と精度のバランスを調査会社とよく相談して、効果的な市場調査をおこなってください。