ほんとうの調達・購買・資材理論「調達関係者に絶対に役立つ統計講座4回目」(坂口孝則)
前回はヒストグラムを作って、そんで標準偏差の考え方までやった。標準正規分布表が使えればかなり面白いとわかってくれたんじゃないかな。
さて、今回は新たなテーマ「相関分析」だ。ほんとうは前回のヒストグラム・標準偏差などの考え方がわかってくれていたほうがいいけれど、ここからでも大丈夫だ。
まずね。相関分析とは、文字通り、何かと何かの連関性を見てみるものなんだ。たとえば調達・購買なら、何かと価格との連関性を見られる。たとえば、重さとか面積とか体積とか……それらと価格の連関性を把握できれば、新たな調達品について価格を推定できる。
じゃあ、どうやって、その連関性を見ればいいのだろうか。Excelを使って説明していくけれど、今回も便宜的にネジと重さの関係を見てみよう。
<クリックすると大きくできます>
今回のエクセルファイルはこれ!
http://www.future-procurement.com/108.xlsx
「ネジの図面重量」と「見積価格」がある。Excelでは、このデータを選択して散布図を作成する。Excelでは、「挿入」→「散布図」を選んでほしい。
<クリックすると大きくできます>
<クリックすると大きくできます>
ここから、相関の強さについて説明していくけれど、その前に、どんな相関があるかを述べてみる。
相関といっても、大きく三つある。
まず、正の相関の場合。これは、まあ右肩上がりのもの。Excelのグラフを想像してくれればいいけれど、横軸の値が大きくなるほど、縦軸の値も大きくなるような場合だ。
次に、負の相関。これは、右肩下がり。よく「右肩下がりの経済」とかいうよね。あるひとは同じ内容を「左肩上がり」って言い換えたんだけどね。これはExcelでは、横軸の値が増えるほど、縦軸の値が減る。
それと無相関のケースだ。
今回の事例はもちろん正の相関がある。だから、見積り価格などの例でいえば、ネジの重量が増えるほど、価格も高くなるっていうわけだ。これは直感的にも正しいだろう。重いほど材料費もかかるし、加工の時間もかかるだろうし……。
それで、さきほど保留しておいた「相関の強さについて」進もう。このときに、グラフに近似線を弾いてみよう。グラフの点をマウスで指しておいて右クリックだ。
<クリックすると大きくできます>
そうすると、「近似直線の追加」が出る。
<クリックすると大きくできます>
そこから「グラフに数式を表示する」にくわえ「グラフにR-2値を表示する」にチェックを入れよう。
そうすると、こんな感じで数式と、R2なるものを表示してくれる。
<クリックすると大きくできます>
ここで見ると、「y=0.8355x+140.5」となっているよね。この意味は(説明するまでもないかもしれないけれど)、y(価格)っていうのは、x(重さ)の0.8355倍に140.5(円)を足したもので表現できる、というわけだ。だから、これ以降も、もし新たな重さのネジがあったとしたら、上記の数式にあてはめてみればいい。
じゃあ、このR-2値(R2)ってなんなんだ! と思うかもしれない。これは決定係数と呼ばれるもので、相関係数を自乗したものだ。完全な正の相関のとき相関係数は1をとり、完全な負の相関のとき相関係数はマイナス1に近づく。だから、それ(相関係数)を自乗したものが1に近いほど相関性が強いわけだ。今回は、R2が0.9を超えているから、かなり相関性が高いわけだ。
これらのデータをExcel関数で求めることもできる。
<クリックすると大きくできます>
まず、「y=0.8355x+140.5」の傾きを求めるには、=slopeという関数で、切片は=intercept関数だ。それぞれ、Excelファイルを見てほしいけれど簡単に計算できる。そして、相関(係数)は=correlだ。それを自乗したものが決定係数だった。
目安は、
[相関係数]
0.9以上:すごく強い相関
0.7~0.9未満:強い相関
それ以下:相関はある、あるいは弱く相関がある、無相関
となるだろう。要するに、価格分析などをしようと思ったら相関係数が0.7以上ほしい、それ未満ならやり直し!ってこと。
・そして見た目の相関に惑わされないようにしよう!
調達・購買の世界ではこれを「コストドライバー分析」という場合もある。今回は重さだったけれど、価格に決定的な影響を与えるものを「コストドライバー」と呼び、それと価格とを相関分析するのだ。こうやって価格とコストドライバーを分析できると、さまざまな応用が効く。
これまで、漠然としていた、コストドライバーと価格の関係が、数式によって明確になるのだ! もしかすると、価格低減のヒントになるだろう。あるいは、自分がコストドライバーと思っていたものがコストドライバーでない(分析結果、相関係数や決定係数が低いかもしれない)ケースは、異なる何かがコストドライバーかもしれない。それは価格分析のキッカケになるだろう。
ただし、最後に注意を一つ。
というのも、下のグラフのような場合だ。これは、詳しくはExcelシートを見てほしいんだけれど、決定係数が0.99という異常に高い値を示している! これは完璧な分析! なんだろうか。
<クリックすると大きくできます>
それは違う。なぜなら、一つだけ外れ値があるからだ。最後のネジだけ、重すぎ!しかも価格が高すぎ!こんな例外値を入れて分析しようとすると、ロクでもない結果になる。ここだけ覚えておいてほしい。
その証拠に、最後のネジだけデータから削除してみたところ、決定係数は0.0007となり、ほぼ無相関となっている。こういう目作業は必ず必要だ。そこだけ注意してもらって、統計の分析を進めていこう!
<つづく>