ほんとうの調達・購買・資材理論「調達関係者に絶対に役立つ統計講座8回目」(坂口孝則)
*今回は長いので、ご印刷して読む、お時間のあるときに読む、あるいは潔く読まない、のどれかを決断ください(笑)
さて今回も実務で使える統計について説明していく。
今回のテーマは、「お前のいっていることはほんとうか?」を検証する方法だ。今回のテーマが一番難しい。たぶん。途中まで読んでわからなかったら、また読みなおしてほしい(あるいは結論だけでも知っておいてほしい)。今回も、t検定だとかF検定とかっていうのを使う。
統計では、簡単なグラフ作成からはじめて、t検定だとかF検定とかを学ぶんだけれど、ここまで来ると多数のひとが頓挫してしまう。でも、できるだけ私は容易にお伝えしていこうと思う。おそらく、今回を理解してくれれば、なんたら検定などの使い方がわかって、検証マスターになれるはずだ。
・少しだけ前回のおさらい
そこで、ほんのすこしだけ前回のおさらいをする。前回は、資格取得が役立つかをテーマに検証した。
<クリックすると拡大できます>
で、このときに私は、Excelのデータ分析で「t検定:一対の標本による平均の検定」を使って検証しようと勧めた。詳しくはバックナンバーを読んでほしいんだけれど、もちろんはじめてお読みの方にもわかるように説明したい。
このとき、資格を取得することで各調達部員のコスト削減率が向上するかを調べた。注意してほしいのは、同じひとたちが、どれだけスキルを上げたかを比較して調べた。アンダーラインは「同じひとたち」ってところだ。というのもね、実は今回のテーマではここが重要になる。
たとえば、こういう場合がある。
ケース①:同じ標本での繰り返し
<クリックすると拡大できます>
Aさん、Bさん、Cさん、Dさん、Eさん、がそれぞれ昔と今で異なっている場合。それは、たとえば、
・昔と今とくらべて体力は落ちたといえるか?
・昔と今とくらべて視力は落ちたといえるか?
・昔と今とくらべて、何か新しいトレーニングを開始していたとしたら、そのトレーニング効果はあったか?
・昔と今とくらべて、資格取得しているとすれば、その資格取得は意味があったか?
などという疑問について、前回同様の手法(「t検定:一対の標本による平均の検定」)が使える。
あるいは上図のもう一例のように、広告Aと広告Bがあって、それぞれ効果があったかどうかを見たい場合。
・広告Bは広告Aよりも効果があったのか?
・各エリアで広告Bは売上増加効果があったといえるのか?
などといった疑問についてもおなじく、前回同様の手法(「t検定:一対の標本による平均の検定」)が使える。
でもね。こういうケースがある。
ケース②:違う標本で抽出したサンプル同士を比べる
<クリックすると拡大できます>
「昔の日本人の身長」と「今の日本人の身長」を比べようって場合だね。つまり、10年前と現在で日本人の身長は伸びたといえるのか?といった疑問のとき。これは、同じひとでは比べられないよね? だから、サンプルを抽出して標本同士の比較となる。
これは、たとえば製品の性能差を見るときも同じだ。たとえば、空気清浄機AとBがあって、空気中に含まれるゴミ量を見ようとするとき。これも、まったく同じ空間を再現できない以上は、サンプルの比較となる。そうすると、おなじく標本同士の比較となる。
ということで、ケース①とケース②にわかれる。二つの違いに注意してほしい。
・さらにややこしいがケース②はさらに二つにわかれる!
で、あまり混乱させたくないんだけれど、ケース②はさらに二つにわかれるんだ。
<クリックすると拡大できます>
ここで、ケース②において二つの標本を単純にExcelのデータ分析でt検定すればいいかっていうと、そうじゃない。というのもね、さっきの例でいうと「昔の日本人の身長」と「今の日本人の身長」を抽出したとき、または空気清浄機AとBがあって、空気中に含まれるゴミ量を見ようとするとき、その標本AとBが同じくらいバラついているかを調べなければいけない。
これは決して正しい解説じゃないんだけれどね。こう思ってほしい。つまりね、そもそも「同じようにバラついているもの同士を比較」するならExcelにそう命令して分析してもらう。「違ったバラつきの標本同士を比較」するんなら、あらかじめExcelにバラつきがあるから覚悟しろよ!と教えておいたうえで、分析してもらうことになる。バラつきっていうのは、等分散か不等分散かって言い方をするんだ。
じゃあ、「同じようにバラついている」といって良いのか、あるいは「違ったバラつき」といって良いのか悩むかもしれない。そのときにF検定というものを使う(後述)。そうすれば、「同じようにバラついている」といって良いのか、「違ったバラつき」といって良いのかわかるから、それに応じたt検定をすればいい!
こうまとめてみる。
(1)同じひとだとか同じ地域での比較分析→そのまま「t検定:一対の標本による平均の検定」に持ち込む
(2)違う標本同士での比較分析→F検定を実施→「同じようにバラついている」んなら→①「t検定:等分散を仮定した2標本による検定」
(3)違う標本同士での比較分析→F検定を実施→「違ったバラつき」なんなら→②「t検定:分散が等しくないと仮定した2標本による検定」
と、こんな感じだ。
<クリックすると拡大できます>
・もうちょっとだけがんばれば統計は使える武器になる!
では、ここでやっと今回のExcel表をお渡ししよう!
http://www.future-procurement.com/111.xlsx
ここで用意したのは「佐賀県における10年前の日本人身長」「佐賀県における現在の日本人身長」の比較だ。なんと安直な(私が佐賀県出身だからだ)決め方か、とも思うがご容赦願いたい。
ここでまずはシート「元の表」っていうのを見てほしい。この二つの標本を比較して、差があるかを分析するのだ。そこで、上で説明したとおり、F検定ていうのをやるんだけれどね。F検定とは、簡単にいえば、二つの標本がどうバラついているか(バラつき方は同じか違うか)を見るものだ。
<クリックすると拡大できます>
そこで、前回もやったけれど、何かの検定をやるときっていうのは、「対立仮説」と「帰無仮説」っていうのを設定して、それを調べる。
・対立仮説:違いがある!という仮説
・帰無仮説:違いなんてない!という仮説
だから、今回のF検定にあてはめると、
・対立仮説:バラつきがあるんだ!という仮説
・帰無仮説:バラつきなんてない!という仮説
となるよね? そこでExcelを使ったF検定だ。「データ」→「データ分析」から「F検定:2標本を使った分散の検定」を選択する。
<クリックすると拡大できます>
あとは範囲設定するだけだ。
<クリックすると拡大できます>
そうすると、結果が出る(シート「元の表 (F検定)」)。
<クリックすると拡大できます>
結果は「P(F<=f) 片側 0.40554336」となっているよね? これ、覚えているかな? 前回に説明したとおり、
・両側検定は、単に違うか調べたいとき!
・片側検定は、良くなったり悪くなったり、大きくなったり小さくなったり、効果あったりなかったり、を調べたいとき!
だったよね。今回は、「単に違うか調べたい」わけだから、両側検定をすることになる。片側が40%ということは、両側としては80%にもなる!
果たして、これはどういう意味だろうか? 帰無仮説は「バラつきなんてない!という仮説」だった。その可能性が80%もあるというんだ。
<クリックすると拡大できます>
こんな図を書いて説明したけれど、今回、この帰無仮説が成り立つ可能性=p値が5%以下であれば、あんまり考えなくてもいい。
<クリックすると拡大できます>
だけど、今回は、80%なので、5%をはるかに超えている。
<クリックすると拡大できます>
つまり、たまたまこれくらいの差が出ちゃうことは、「よくありうる話」なんだ。だから、<帰無仮説:バラつきなんてない!という仮説>を棄却することはできない。
<クリックすると拡大できます>
ということで、私たちは上記の①に進むことになる。すなわち、「同じバラツキ=等分散、t検定=等分散を仮定した2標本による検定」を進めていこう。
・やっとこさt検定のはじまり
ここで私たちは等分散を仮定した検定に進む。シート「元の表 (t検定)」を見てほしい。Excelのやり方は、ほとんどF検定と一緒だ。だけれど、ここでも「対立仮説」「帰無仮説」の考え方が重要だ。t検定は違いを調べるものだった。
・対立仮説:違いがある!という仮説
・帰無仮説:違いなんてない!という仮説
だから、今回のt検定にあてはめると、
・対立仮説:身長は伸びているんだ!という仮説
・帰無仮説:身長なんて伸びていない!という仮説
になるよね? 「データ」→「データ分析」から「t-検定: 等分散を仮定した2標本による検定」を選択する。
<クリックすると拡大できます>
あとはこれまでどおり範囲指定してくれれば大丈夫。やり方じゃなくて、注意したいのが、この結果だ。今回は、片側検定を使う。なぜか、再掲するけれど、
・両側検定は、単に違うか調べたいとき!
・片側検定は、良くなったり悪くなったり、大きくなったり小さくなったり、効果あったりなかったり、を調べたいとき!
だから、身長が伸びたか積極的に検定するためだ。で見てみると、24%!! 「帰無仮説:身長なんて伸びていない!という仮説」が24%もの確率で<ありうる>のだ。したがって、この仮説を棄却できない! つまりこの場合は、「身長なんて伸びていない」ことになる!
じゃあ逆にこの数字が5%以下だったら? その場合は、「帰無仮説:身長なんて伸びていない!という仮説」は5%以下しか<ありえない>から、むしろ「対立仮説:身長は伸びているんだ!という仮説」を採用することになる。こうやって、検証は終わりだ。
・その他のケースについて(参考)
上記が分析のやり方だった。あとは数値によってさまざま変化するだけだ。基本的なやり方は変わらないものの、念のためいくつかのケースをExcelシートとしてつけておいた。
繰り返すと、手順は、こうだった。
(1)同じひとだとか同じ地域での比較分析→そのまま「t検定:一対の標本による平均の検定」に持ち込む
(2)違う標本同士での比較分析→F検定を実施→「同じようにバラついている」んなら→①「t検定:等分散を仮定した2標本による検定」
(3)違う標本同士での比較分析→F検定を実施→「違ったバラつき」なんなら→②「t検定:分散が等しくないと仮定した2標本による検定」
ここでExcelシート「元の表パート2」は、F検定結果が等分散(同じようにバラついている)で、「t検定:等分散を仮定した2標本による検定」結果、帰無仮説が棄却され「身長は伸びている!」というもの。
<以下、参照~「元の表パート2」の分析>
<クリックすると拡大できます>
<クリックすると拡大できます>
<クリックすると拡大できます>
<クリックすると拡大できます>
さらにExcelシート「元の表パート3」は、F検定結果が不等分散(違ったバラつき)で、「t検定:分散が等しくないと仮定した2標本による検定」結果、帰無仮説が棄却されずに「身長は伸びていない!」というもの。
やり方はまったく同じなので、画像は貼り付けない。何度も何度も説明するまでもないかもしれないけれど、この場合はExcelのデータ分析から「t検定:分散が等しくないと仮定した2標本による検定」を選択するのを忘れないこと。ここでは意味だけ再確認しよう。
<クリックすると拡大できます>
Excel右上部のところでは、「バラつきなんてない!という帰無仮説が2.6%の確率しかない(1.3%は片側だから倍にした)」と書いてある。文字通り、これは、バラつきがある、との意味になる。だから、「t検定:分散が等しくないと仮定した2標本による検定」をやるんだけど、そこで
・対立仮説: 身長は伸びているんだ!という仮説
・帰無仮説: 身長なんて伸びていない!という仮説
の帰無仮説が成立する可能性は……。
<クリックすると拡大できます>
Excel右下部にあるように、9.7%の確率にもなる。つまり、帰無仮説(身長なんて伸びていない!)を棄却できない。よって、結論は「身長は伸びていない!」となる。
だから、まとめると
-
シート1「佐賀県における10年前の日本人身長」と「佐賀県における現在の日本人身長」の比較結果:身長は伸びていない!
-
シート2「佐賀県における20年前の日本人身長」と「佐賀県における現在の日本人身長」の比較結果:身長は伸びている!
-
シート3「佐賀県における15年前の日本人身長」と「佐賀県における現在の日本人身長」の比較結果:身長は伸びていない!
とこうなるわけね。
・ややこしい検証ではあるけれど
統計学としての厳密な解説よりも、実務的に使える尺度でお話してきた。たぶん、これがいままでで一番カンタンな統計検証の説明だと、私は思う。しかし、それでもなお、「難しい!」「なんなんだ、なんたら 仮説って!」と思うかもしれない。もちろん、その気持はわかる。
とくに、統計では「帰無仮説」っていう、「ほんとうは変化しないんじゃねえの?」というネガティブな仮説をあえて立てたうえで、それを検証する。これが、意味わからん。なんで、単純に検証できる方法がないんだよ!! と思ってしまうだろう。まあまあ、たしかにそのとおり。でも、慣れれば大丈夫、とも思う。
Excel表を見ながら、しばらく考えてくれれば、きっと理解できるはず。もうちょっとで統計を使いこなせるはずだ。ほんとうは、やや雑な説明だけれど、実務的な検証にはこれで大丈夫だ。
では、もうちょっとだけ続けます。
<つづく>