0
会員になると、いいね!でマイページに保存できます。
ビジネスパーソンにとって、データの重要性はますます高まってきている。しかし、データをただ眺めているだけでは何も得られない。分析して初めて、使える情報となる。そこで役に立つのが統計学だ。「統計学を使えば、漠然と見ていたのでは分からない『事実』を発見でき、予断や先入観に左右されないで冷静な判断ができます」と語るのは、経済学博士の小島寛之氏。本稿では小島氏に「あるアパレルショップの試験店が成功したのかどうか?」という題材で統計学を解説してもらう。
20代向けアパレル試験店舗は成功したのか?
話の発端は、アパレル系の企業に就職したという卒業生の話だ。ショップは、主に30代半ば~50代くらいのミドル層をターゲットにしているという。といっても完全にミドル層向けというわけでもないらしく、若者のなかにも愛用者がいる。ならば、と、20代の若者を意識した商品をもっと取りそろえ、いっそう若者を呼び込もうという戦略が打ち出された。
試験的に、まずは1店舗で新たな商品展開が実践されることになり、プロジェクトチームが組まれた。そして、いよいよ試験店で新しい商品展開を実践する初日。閉店後には、お客の年齢層の集計が出された。試験店では、200人中、20代と思しき若者は40人だった。実は同日、同規模の別の従来店でも同様にカウントしていたのだが、200人中、20代と思しき若者は30名だった。同じ200名で比べたら、試験店のほうが従来店より10名、若者のお客が多かった。
この数字だけ見れば、試験店の実践は、まずまず好調な滑り出しと思えるかもしれない。だが、本当のところはどうなのか。私は提案した。「じゃあ、今日は僕から久々に宿題だ。試験店は、若者の呼び込みに成功したのか? それとも、成功したわけではなく、たまたま従来店より若者が多く来ただけなのか? 検証してみよう」
「帰無仮説」か「対立仮説」か
仮に、従来店をA店、試験店をB店としよう。はたしてB店は、若者の呼び込みに本当に成功したのか? それには「
仮説検定」という統計学の手法が使える。仮説検定とは、読んで字のごとく、仮説を検定するということ。つまり、あるデータについて仮説を立て、それが正しいかどうかを検証するのである。
まずキモとなるのが、どういう仮説を立てるか、である。統計学では、まず「
帰無仮説」というのを立てて、それが成立するかを検証する。帰無仮説とは「無に帰するかもしれない仮説」、もっといえば「棄てられるべき仮説」ということだ。この帰無仮説が成り立たないと判断されたときに受け入れる仮説は、「
対立仮説」という。
それにしても、せっかく仮説を立てるのに、なぜ「棄てられること」を前提とするのかと思ったかもしれない。それは、仮説検定で仮説が不採用にされる場合、「『この仮説はありえない』と強く否定」されるからだ。
一方、仮説が否定されない場合は、「この仮説は棄てられない」という具合に、弱く肯定される。肯定はするが、その根拠は弱く、いってしまえば「棄てる根拠がないから残す」ということだ。これでは、とらえたい真実もぼんやりしてしまう。だから、まず「棄てられるべき仮説」を立てて、検証するのだ。
では、このセレクトショップの場合は、どんな仮説を立てたらいいだろう。ここで排除されるべき可能性は、「
試験店(B店)は若者の呼び込みに成功しなかった」という可能性だ。ならば、これを帰無仮説とし、反対側の「
試験店(B店)は若者の呼び込みに成功した」というのを対立仮説としよう。検証の結果、帰無仮説がボツにされれば、試験店の試みは成功したと考えてもいいことになる。
検証のイメージは「クジ引き」
仮説を立てたら、検証していく。仮説検定では、立てた仮説のもとで何かを推定し、その推定が現実に観測されたデータを説明できているのかを検証する。そして最後に、仮説を不採用にするのかどうかを判断するのだ。
検証の対象となる現象は来客の年齢層であり、「若者が来た」「若者でない人が来た」という2種類である。ならば、「若者が来た(成功)」を「1」、「若者でない人が来た(失敗)」を「0」とする考え方が使える。このように、成功を「1」、失敗を「0」とするモデルを、その名も「
成功・失敗モデル」(
二項分布)という。つまり、これから「B店は若者の呼び込みに成功したかどうか」を、「成功・失敗モデルを使って検証していく」ということだ。
では、次。帰無仮説の「B店は若者の呼び込みに成功しなかった」というのは、どのような確率現象としてとらえたらいいか。
クジ引きの箱をイメージしてほしい。その箱には「1」と書かれたクジと「0」と書かれたクジが入っている。今もいったように、「0」は「若者でない人」、「1」は「若者」のクジだ。ここでは引いたクジはそのたびに箱に戻すことにする。
「
A店の200人の来客数のうち若者が30名だった」というのは、200回、クジを引いたうち、「1」が30枚だったということだ。
一方、「
B店の来客数200名のうち若者は40名だった」というのは、200回、クジを引いたうち、「1」が40枚だったということだ。
問題は、クジ引きの箱のなかに入っている「1」の割合が、A店が引いた箱とB店が引いた箱とで異なるか、である。言い換えれば、A店のクジ引き箱とB店のクジ引き箱は、はたして同じものなのか否か、ということだ。
もしB店の箱の「1」のほうがA店の箱の「1」よりも多いのなら、各店で「1」を引き当てる確率は当然、元から違う。すなわち、B店が若者を呼び込むポテンシャルは、A店よりも高いことになる。
このように、もとから箱が違うのならば、B店は若者の呼び込みに成功したといえる。逆に箱が同じならば、B店がA店より多くの「1」を引いたのは、「たまたま」だった、ということになる。だから、「
各店が引いている箱が同じなのかどうか」が、「B店は若者の呼び込みに成功したのかどうか」を検証するための、重大な問いとなるのだ。
帰無仮説「B店は若者の呼び込みに成功していない」は、A店のクジ引き箱もB店のクジ引き箱も、同じ割合の「1」が入っており、引いた「1」の数が違ったのは「たまたま」だったということだ。つまり、A店のクジ引き箱もB店のクジ引き箱も「同じ」ということ。
だったら、その仮説が成立するかどうかを検証するには、まず、A店の箱、B店の箱と分けずに、
箱を合体して、400回クジを引いたら、30+40=70回だけ「1」を引いた、と考えてしまえばいい。引く回数が多いほうが「1」の割合が真実の確率に近づくからだ。
その架空の合体クジ箱から、A店とB店が200枚ずつクジを引いた場合、A店は30枚の「1」、B店は40枚の「1」を引くという差が出るなんてことが、はたして、ありうるのだろうか? ありえないとしたら、200人の来客数のうち、A店よりB店のほうが10人、若者が多かったのは、「たまたま」ではなかったということ。したがって帰無仮説「試験店(B店)は若者の呼び込みに成功しなかった」は不採用となる。
【次ページ】この「差」って何ですか?
関連タグ