ほんとうの調達・購買・資材理論「調達関係者に絶対に役立つ統計講座3回目」(坂口孝則)

さて前回、重要な標準偏差について学んだ。前回は暴論を申し上げた。理屈なんてわからなくってもいい。<標準偏差っていうのは、「平均値からこれくらいバラつくぜ」という値>と思ってくれ、と。

だから、これからは恐れる必要がない。標準偏差? ああ、つまり平均値からその標準偏差を足したり引いたりした値は、「ありうるバラつき値なんだな」と考えればいいだけだ。

ちょっとしつこいけれど、おさらいだ。

たとえばネジの平均重量が10グラム、そして標準偏差が1グラムだったとしよう(あくまで例)。そうすると、標準偏差は「平均値からこれくらいバラつくぜ」だったから、このネジっていうのは

・10グラム+1グラム=11グラム
・10グラム-1グラム=9グラム

だから、9~11グラムの範囲をとりうるぜっていうことだ。

・標準偏差と正規分布の美しき世界

さて、今回の内容を進めよう。以前、ネジの重量をヒストグラム化したときには、こうなっていたよね。

<クリックすると拡大できます>

そこで、この形をみてほしいんだけれど、なんとなく釣鐘状になっていると思う。ベルを逆さにした感じがするよね。まあ、そう思ってほしい。これをね、正規分布という。

また難しい単語が出てきた。正規分布! ただし、これまたざっくりとこう覚えよう。「中心から左右になだらかに分布しているもの」とね。世の中の多くのものは、正規分布にしたがって存在している。

正規分布の特徴は次の通りだ。絵で説明しよう。

<クリックすると拡大できます>

まず、さっきいったとおり「釣鐘の形になっている」ことと「平均値を中心に左右対称」になっていることだ。

それで「標準正規分布」っていう単語もある。これは覚えたくなければ覚えなくてもいいけど、平均値が0で、標準偏差が1の正規分布のことだ。

ところで、この正規分布っていう概念がわかれば何が凄いかという実務面の説明に移る。それは、ある範囲で起きる事象の確率がわかるからだ! たとえば、データさえあれば「95%の確率で起きうる」ことが予想できる。統計が武器になるためには、この確率っていうのが重要。今回は、あとで練習問題もやってみる。

ただ、ここで、自分が集めたデータがほんとうに正規分布になっているかを確認してみよう。もちろん、<世の中の多くのものは、正規分布にしたがって存在している>と書いたので、大半はそうだろう。でも、例外もあるからだ。

たとえば、なかにはこういうグラフになっちゃうかもしれない。

<クリックすると拡大できます>

のっぽさんみたいな形だ。逆に、こういうこともあるだろう。

<クリックすると拡大できます>

なだらかな尖り具合の場合だ。

または、左に傾いていたり、

<クリックすると拡大できます>

逆に右に傾いていたりするかもしれない。

<クリックすると拡大できます>

じゃあ、自分が集めたデータの判別方法を教えよう。Excelがあれば簡単だ。

・「データ分析」機能さえあれば簡単に料理できる

そこで、Excelの「データ」→「データ分析」→「基本統計量」を選択してほしい。Excelの初期状態によってはインストールされていない可能性もある。あなたのパソコンへのインストール・設定はウェブなどで調べてほしい。

そうして、データ(この場合はネジの重さを使う)を選択すれば、勝手に各種の統計情報を算出してくれるんだ。

今回使うファイルはこちら!

http://www.future-procurement.com/z108.xlsx

<クリックすると拡大できます>

<クリックすると拡大できます>

<クリックすると拡大できます>

おっと、「平均」や「標準偏差」「最小」「最大」も計算してくれるんなら、前回連載で説明したExcel関数は必要なかったんじゃないか……とはいわないでほしい。ここで注目してほしいのは「尖度(せんど)」と「歪度(わいど)」だ。

こう覚えておこう。

尖度プラス:とがる
尖度マイナス:なだらかになる

歪度プラス:左に山が寄る
歪度マイナス:右に山が寄る

そんで、実務的には? こう考えよう! 「尖度」も「歪度」もプラスマイナス1の範囲だったら、正規分布とみなす!と。これは学問的には厳密でない。しかし、これでいい。-1~+1の範囲だったら「ニアリー正規分布」とかなんでもいいけれど、こういう基準を持ってほしいんだ。

そうすると、この実例のネジ重さデータでは、尖度、歪度がそれぞれ「-0.519975717」「-0.085298875」だった(ちょっと見づらいけれど、上の図を見てくれ)。だから、これは-1~+1の範囲に入っているよね。だから、正規分布とみなそう!

・それで、結局のところ、何が言えるんだ?

そして、一見したらわからないかもしれないけれど、こう覚えてくれ。あとで練習問題するからね。

・正規分布にしたがうとわかれば、その平均から標準偏差の1倍の範囲をとる確率は68%である
・正規分布にしたがうとわかれば、その平均から標準偏差の2倍の範囲をとる確率は95%である
・正規分布にしたがうとわかれば、その平均から標準偏差の3倍の範囲をとる確率は99%である

これって、実はすごいことなんだ。例題をやってみようか。

・ある車両のエンジンで使用するガソリンが10キロあたり1リットルで、標準偏差0.1リットルの正規分布にしたがうとする。そのときに……。

・1リットル±0.1リットル=0.9リットル、1.1リットル
→つまり、10キロ走るときに、0.9リットルから1.1リットルのあいだの消費量になる確率は68%

・1リットル±0.1リットル×2=0.8リットル、1.2リットル
→つまり、10キロ走るときに、0.8リットルから1.2リットルのあいだの消費量になる確率は95%

・1リットル±0.1リットル×3=0.7リットル、1.3リットル
→つまり、10キロ走るときに、0.7リットルから1.3リットルのあいだの消費量になる確率は99%

というわけなんだ。でね、これは逆のこともいえるわけだよ。つまり、どこまでリスクをヘッジするかというのは、結局のところ確率におうじて施策立案することだ。

・標準正規分布表まで使えれば完璧

じゃあ、その「確率におうじて施策立案する」とはなんだろうか。確率から逆算して、どの範囲まで考慮すべきかを決めてみよう。そこで、標準正規分布表がある。これはネットで調べてもいいけれど、サンプルを用意した。どうぞ!

http://www.future-procurement.com/hyojun.xlsx

そこで、こういうファイルになっているはずだ。

<拡大する意味はないけれど、クリックすると拡大できます>

そこで、こういう問題を解いてみようか。

[問題]あるサプライヤは某成形品の受注個数が、ほとんど正規分布にしたがっていると思われ、平均は2000個、標準偏差500個である。そのときに、サプライヤの営業本部長が知りたいのは、80%くらいの確率で収まる在庫個数の範囲であった。なぜなら、その範囲がわかれば80%の確率で問題なく受注をこなせるからだ。

[解答]80%の確率でオッケーな在庫個数だ。つまり、その範囲さえ把握しておけば、80%の確信をもって営業本部長は売り上げ個数を予想できるのだ。まずここでやってほしいのは、80%の半分、つまり0.4のセルを見つけることだ。

なぜ80%の半分か!!!って。これは伝統的に、標準正規分布表っていうのは、片側の確率しか載せていないのだよ。だから、半分にしてあげる。そうすると……。

<拡大する意味はないけれど、クリックすると拡大できます>

一番近いのはセル「K27」に0.3997ってあるよね? この表の見方なんだけれど、このセル「K27」のずっと横に行ってもらうと、「1.2」と書いてあって、「K27」のずっと上にいってもらうと、「0.08」と書いてあるよね。

これ、二つの数字をあわせて、「1.28」の意味なんだ。何が1.28か? これは標準偏差の1.28倍の意味なんだ!

つまり、こういうこと。

2000個(平均値)±500個×1.28=1,360個~2,640個となる確率が80%ということだ!

この営業本部長は、80%の確信をもって売り上げ個数は、1,360個~2,640個と予想できる。それであとは2,640個の在庫を実際に持つかは、コストとにらめっこして決めればいい(要は投資対効果というヤツだね)。

ということで標準偏差が使えれば、そして標準正規分布表が使えれば、いろいろな可能性が広がる。おそらく読者のなかには、活用法について思いついたひともいるんじゃないかな。そして、この簡単な統計講座は続く。

(つづく)

無料で最強の調達・購買教材を提供していますのでご覧ください

あわせて読みたい