ほんとうの調達・購買・資材理論「調達関係者に絶対に役立つ統計講座9回目」(坂口孝則)
*今回もこの連載は長いので、ご印刷して読む、お時間のあるときに読む、あるいは潔く読まない、のどれかを決断ください(笑)
さて今回も実務で使える統計について説明していく(お忘れの方はバックナンバーを参照のこと)けれど、理屈編はそろそろ終わりに近づいている。
今回、紹介したいのは「Χ2自乗検定(かいじじょうけんてい)」というものだ。これはさまざまな説明ができる。難しくいおうとすれば「観察された事象の相対的頻度がある頻度分布に従うという帰無仮説を検定するもの」だそうだ。うわー。まったくなんのことかわからん。
だから、ここではこう考えてみてほしい。「Χ2自乗検定(かいじじょうけんてい)」とは、「ある事象の頻度について、二つの標本に違いがあるかどうかを調査するもの」と思ってほしい。これまでの連載で扱ってきたのは、定量的なデータだったよね。でも、「Χ2自乗検定(かいじじょうけんてい)」は頻度を扱うんだ。
この違いがキモになるので少しまわりくどいけれど考えてみよう。
たとえば、
1.A国とB国の30人をそれぞれ抽出し、身長をデータにまとめる。このときA国とB国に身長差があるといえるか
2.マーケティング手法AとBでそれぞれ新商品を販売してみた。各店舗の売上高を集計し、手法AとBで差があるといえるか
3.夏目漱石の小説「こころ」と「三四郎」の二冊を分解し、夏目漱石が「私」「俺」の登場回数を調べた。夏目漱石の主語は「私」「俺」しかないとすれば、「こころ」と「三四郎」で主語「私」「俺」を使う頻度が違うといえるか
4.男性社員と女性社員に「仕事が好きか」とアンケートした。このとき男女に回答差があるといえるか
5.大卒選挙民と高卒選挙民に「これまで投票に行ったことがあるか」とアンケートした。このとき学歴によって回答差があるといえるか
これらの例を考えてみよう。1.2.は前回までの連載でやったように、「t検定」というやつを使う。これは「Χ2自乗検定(かいじじょうけんてい)」じゃないんだ。それで「Χ2自乗検定(かいじじょうけんてい)」が扱う頻度ってどれだろう? そう、4.5.だ。アンケートしたら、「好き」「嫌い」または「はい」「いいえ」の頻度が出るはずだよね。
ただ、悩むのは3.かもしれない。これは「Χ2自乗検定(かいじじょうけんてい)」だ。というのも、ここでは夏目漱石が使う主語は「私」か「俺」としている。だから、これも頻度になるんだ。
わかるかな? 数値そのものか、あるいは何かが出てくる頻度か。これが「Χ2自乗検定(かいじじょうけんてい)」を理解するにまず覚えてほしいポイントだ。
・では「Χ2自乗検定(かいじじょうけんてい)」をやってみよう
そこで、今回のExcel表だ。
http://www.future-procurement.com/112.xlsx
(これまでのエクセル表がダウンロードできない場合、会社のセキュリティがかかっているケースがほとんどです。ご自宅でダウンロードしなおしてください)
不謹慎な例で恐縮だが、こういうものを考えてみた。部にいる男性バイヤーと女性バイヤーに、それぞれ「仕事は楽しいか?」とアンケートしてみた、という仮定だ。
結果がこうだったとしよう。
男性バイヤー:「仕事が面白い・33人」「仕事がつまらない・35人」
女性バイヤー:「仕事が面白い・17人」「仕事がつまらない・10人」
このとき、一見するところ、女性のほうが「仕事が面白い」と答えた率が高そうに思える。しかしこのとき、「女性は仕事を楽しんでいる」と思っていいんだろうか。それとも、たまたま、今回はアンケートで女性がそう答えただけで、統計的に差があるとはいえないんだろうか。さあ、どっちだろう。
この「Χ2自乗検定(かいじじょうけんてい)」では、期待度数っていうのを計算する。期待度数っていうのは、「まあ、普通だったらこれくらいの数になるよね」っていう数を計算するのだ。
これまたわかりにくいんだけれど、この期待度数っていうのは、次のように計算する。
例:男性バイヤーの「仕事が面白い」の期待度数は、
・男性バイヤーは68人であり
・男女全バイヤー95人中、「仕事が面白い」と50人が答えているから、50÷95=52.6316%
・ということは、68人×52.6316%=35.78946人が、<男性バイヤーの「仕事が面白い」>の期待度数
わかるかな。あえてもう一つやってみよう。
例:男性バイヤーの「仕事がつまらない」の期待度数は、
・男性バイヤーは68人であり
・男女全バイヤー95人中、「仕事がつまらない」と45人が答えているから、45÷95=47.3684%
・ということは、68人×47.3684%=32.21053人が、<男性バイヤーの「仕事がつまらない」>の期待度数
ということなんだね。それを女性バイヤーのそれにも応用して表を完成させる。
・次に乖離をチェックする表を作ろう
それで、次は乖離を調べる。乖離(かいり)って難しいけれど、ここでは単純に「その期待度数と実際のデータはどれくらい離れているんだ」っていう意味。乖離ってのは<違い>ていどに考えてほしい。
ここで、計算は次のようにする。
乖離=(実際のデータ - 期待度数)の自乗÷期待度数
この計算式の意味は? もうこのまま覚えてくれ! あえていうと、期待度数がどれだけ実際と違っているかを減算したあとに、それを期待度数で割る。なんで自乗にするかっていうと、プラスでもマイナスでも絶対値として扱えるように工夫しているわけね。
当然なんだけれど、実際と期待が近いほど、値は小さくなる。実際と期待が離れるほど、この値は大きくなる。それで、この乖離を、すべて合計してみる。
これが何を隠そう(隠していないけれど)「Χ2自乗値」になる。この例でいえば、「Χ2自乗値」は1.614954006だ。でも、この1.614954006ってどう解釈すればいいんだろう。
・次に乖離をチェックする表を作ろう
そこで、この「Χ2自乗値」なんだけれどね。その前に、「自由値」っていうものを知らなければいけない。自由値っていうのは、学問的な定義付けはいろいろあるんだけれどね、実務上は単にこう考えていいと思う。それは次のとおりだ。
(列の数 - 1)×(行の数 - 1)だ。今回は、2×2だから、自由度を求めようと思ったら(2-1)×(2-1)=1が自由度となる。この自由度っていうのはね、「実質的な項目数」のことなんだ。
ほら、「Χ2自乗検定(かいじじょうけんてい)」とは頻度を扱うといったよね。AとB,好きと嫌いっていう四つの項目がありそうに思う。だけれど、計がわかっているんで、実際はAかBのどちらか、あるいは好きか嫌いかのどちらかがわかれば、片方(残ったほう)は自動的に計算できる。だから、この意味で統計に影響を与える項目はマイナス1だと考えるんだ。これが頻度を扱う「Χ2自乗検定(かいじじょうけんてい)」の考えかた。
さらにここで、「対立仮説」「帰無仮説」を立てる。この二つの意味を忘れたひとがいるだろう。だから繰り返すと、こうだ。
・対立仮説:違いがある!という仮説
・帰無仮説:違いなんてない!という仮説
だから、今回の「Χ2自乗検定(かいじじょうけんてい)」にあてはめると、
・対立仮説:男女の仕事の好き嫌いに違いがあるんだ!という仮説
・帰無仮説:男女の仕事の好き嫌いに違いなんてない!という仮説
となるんだよね。
それで、それぞれの自由度を求めたうえで、「境界値」または「臨界値」と呼ばれるものを計算する。なんだそりゃ! と思わないで。Excelですぐに計算できるから。ここでは、単純にこう考えてほしい。自由度さえわかれば、そのデータがたまたまそうなる「Χ2自乗値」が定まる。
まだわからない?
こういうことだ。次の図を見てほしい。
たとえば「Χ2自乗値」が3.841459149だったとするよね。そのとき、たまたま「帰無仮説」が成り立つ可能性は5%以下しかない。だから、「こういうアンケートをとったら、男女の違いがあるように思えるけれど、それはたまたまだよ」との可能性が5%以下しかない。それはどういうことか……。つまり、帰無仮説は棄却されるのだ。対立仮説「男女の仕事の好き嫌いに違いがあるんだ!という仮説」が正しい。
でも、「Χ2自乗値」が3.841459149よりも小さかったら? 逆の結論を導くしかない。
今回は、「Χ2自乗値」が1.614954006だったよね。だから、「帰無仮説:男女の仕事の好き嫌いに違いなんてない!という仮説」が起きうる可能性(確率)は5%よりもはるかに大きい。つまり、「男女の仕事の好き嫌いに違いなんてない!」可能性が高い。アンケートでは違うように見えていたけれど、たしかに「見えていただけ」なんだ。難しくいうと、帰無仮説を棄却できないってことだね。
・Excelで判断基準を計算してみよう
当たり前だけれど、これは5%を基準に持つか、あるいは10%を基準にもつかで、判断が異なってくる。「Χ2自乗検定(かいじじょうけんてい)」では、それぞれ関数で計算できる。具体的にはExcelを見てほしいんだけれど、CHIINVって関数だ。=CHIINV(何%の厳しさにするか,自由度はいくつか)って指定すれば大丈夫。
もう一つのシートには自由度ごとの「カイ二乗分布の臨界値」も表にしてまとめておいた。
いちおうもう一つのやり方としては、p値を求める方法がある。p値って覚えているかな? 帰無仮説が成立する可能性だ。これもExcel関数でできる。具体的にはCHITESTなる関数を使う。これはやや複雑なんだけれど、=CHITEST(実測値範囲,期待値範囲)と選択する。
そうすると、p値は0.203796919みたいだ。
p値は、この連載でこのように説明した。
今回、この考えかたに当てはめると、このアンケート結果(女性のほうが仕事を好きのような気がする結果)について、「帰無仮説:男女の仕事の好き嫌いに違いなんてない!という仮説」が正しいかどうかを見てみるんだ。
これも繰り返すと、p値が5%以下だったら無視する=棄却できた。
そうだったよね。それと、逆にp値が5%以上だったら、無視できない!
今回のp値は0.203796919だから、5%よりも大きい。すなわち、この「帰無仮説:男女の仕事の好き嫌いに違いなんてない!という仮説」という考えを捨て去るわけにはいかない。だから、やはりp値を見ても、「男女の仕事の好き嫌いに違いなんてない!」可能性が高いことがわかった。
……とまあ、こうやって「Χ2自乗検定(かいじじょうけんてい)」ができるのだ。頻度についてデータの違いがあるかどうか分析できるようになった。
理屈編はさほどもう多くない。ラストスパートに向けて走りだそう。
<つづく>