ほんとうの調達・購買・資材理論「調達関係者に絶対に役立つ統計講座6回目」(坂口孝則)
さて今回も実務で使える統計について説明していく。
前回までに相関分析というやつをやった。ネジの重量と価格の連関性を見てみた。で、今回やってみたいのは、もっと複雑な場合だ。前回の例では、重量だけが価格に影響を与えることとしていた。だけど、その他の要因も複雑にからまっていたら?
そこでこんなケースを用意してみた。電源装置を調達する場合だ。えっと……電源装置なんて購入してねえよ、と思われるかもしれない。だから、これは頭のなかでなんて読み替えていただいても大丈夫だ。とにかく、何かの調達品価格があって、その調達品価格がいくつかの要素から決まっている場合だ。
<クリックすると拡大できます>
今回のExcelファイルはこれ!
http://www.future-procurement.com/z110.xlsx
ここでは、この電源の調達価格は
・W数
・仕様規定使用年数
・出力数
・温度範囲
の四つの要素から決まっているんじゃないか、と推測されている。繰り返しになるけれどね、別に「W数」とか「仕様規定使用年数」とかってわからなくても大丈夫。何度もいうけれど、いくつかの要素が価格を決定していると思われる場合を想定してくれればいい。
こんなとき、私たちはどう分析できるだろうか?
まずやってほしいのは、Excelを使って回帰分析をやってみることだ。難しいことは説明しない。実務家だからやり方だけ覚えること! はじめにExcelの「データ」→「データ分析」→「回帰分析」を選択する。そこで、YとXを指定しろといってくるから、Yには価格のところを、Xには各要素のところをまとめて指定してほしい。
<クリックすると拡大できます>
<クリックすると拡大できます>
<クリックすると拡大できます>
細かな話だけれど、YとXを指定するときに「ラベル」にチェックを入れてもらえば、一番上のデータを使って名前付けしてくれる。あと、出力先はどこでもいいので、任意で指定してくれ。
そうすると、こういう表ができるんだ。
<クリックすると拡大できます>
ここで、K列を見ていただけるだろうか。ここには、下のところに「係数」と書いてあるよね?
切片→703.9014
W数→6.457659
仕様規定使用年数→12.59354
出力数→114.6745
温度範囲→-1.34911
となっているよね? これで立派な分析の完成だ! というのも、見積価格というのは、上記から導けるんだ。
価格=W数×6.457659+仕様規定使用年数×12.59354+出力数×114.6745+温度範囲×-1.34911+703.9014(切片)
で表現できるということだ! 最後の「切片」っていうのは中学校で習ったとおり、固定費みたいなもんだから、足してくれればいい。このデータでは、20個のサンプル電源装置を使ったけれど、その他の電源装置を購入するときは、そのスペックを抽出して上記の計算式にあてはめれば、いくらが妥当であるかわかる!
これで未知のものも予想できるはずだ。これは調達品の価格だったけれど、他でも応用できる。たとえば、よく使われるのは売上予測だ。たとえば、お店の立地、気温、接客……多くのパラメーターを用意し、おなじく分析すれば、これから出店する店舗の売上高予想ができるだろう。
・しかし、とはいえ、もっと精度よくしたい場合
ということで、まったくこういう分析をやっていなければ、ぜひやったほうがいい。んだもんだから、今回の連載はここまで! ではあるが、すでに分析を実施していたり、あるいは深く知りたかったりするひとのみ、下をどうぞ!
では、ここからは深く進もう。深くといってもできるかぎり安易に進めていく。さっきの例では、「W数」「仕様規定使用年数」「出力数」「温度範囲」っていうのを平等に扱っていたよね? でも、その他にも要素があるかもしれない。もしかしたら、営業マンによっても価格が違うかもしれないし、また決算時期によるかもしれないし、または想像もつかない価格決定要因があるかもしれない。そういうケースはもちろんある。だから、日々、情報収集したり、製品を学んだりして、要素を網羅しているかを確認しなきゃなんない。
ただ、実務上は、もう一つの問題がある。というのも、要素をてんこ盛りにしすぎて、計算式が複雑怪奇になっちゃうんだな。いや、もちろん、必要なら良いよ。でも何かの要素を排除したほうが逆に精度がよくなることもあるんだ。
<クリックすると拡大できます>
そこで、計算式をスリムにするやり方をお伝えする。
1.回帰分析の「t」値を見よ
2.絶対値がもっとも低い要素を排除せよ
3.そのうえで、もう一度回帰分析せよ
4.そのうえで、もう一度回帰分析の「t」値を見よ
5.そのうえで、絶対値がもっとも低い要素を排除せよ
6.上記を繰り返し、もっとも「補正 R2」が高い組み合わせを選択せよ
となる。なんのことやらわからない? 大丈夫。しっかり読めば絶対に理解いただけるから。
まずね。回帰分析の「t」値を見よう。M列のところだね。
<クリックすると拡大できます>
絶対値が一番小さいもの……、は「温度範囲」だよね(-0.09195となっている)。だから、これを削除してもう一回、回帰分析をしてみればいい。えっと……tの値っていうのは、さほど気にしてくれなくてオーケーだ。目安というならば、絶対値1.4を目安にしてくれ。つまり、t絶対値が1.4より大きければ計算式に影響を持つということ。
そこで、「温度範囲」を消した結果がこちら。
あとはやり方はすべて一緒。次に、「t」値が一番小さい「仕様規定使用年数」を消してみよう。「仕様規定使用年数」を消した結果がこちら。
<クリックすると拡大できます>
次に「出力数」を消した結果がこちら。
<クリックすると拡大できます>
……とだいぶスリムになったね。最後は「W数」だけだから、単回帰分析と変わらない。前回までの講義と同じだね。
そこで上記手順の「6.上記を繰り返し、もっとも「補正 R2」が高い組み合わせを選択せよ」をみてほしい。ここでは、新登場の「補正 R2」を確認せよとしている。
そこで、各分析の画像には「補正 R2」を黄色で塗っておいた。このなかで、もっとも「補正 R2」が高い組み合わせはどれだっただろう? 一覧表にしておいた(Excelファイルにつけている)。
この結果でわかるとおり、
<クリックすると拡大できます>
こうなっているので、最良の組み合わせは<次に「仕様規定使用年数」を消した>っていうケースだ。このシートでは、「W数」と「出力数」の二つを利用し分析している。これがもっとも優れているというのだ。この場合の「補正 R2」が高いことはおわかりいただけると思う。
<クリックすると拡大できます>
よって、この電源装置価格を推定しようと思えば、「W数」と「出力数」の二つで分析すれば良いことになる! (何度もいうとおり、まずは「W数」「仕様規定使用年数」「出力数」「温度範囲」のすべてを使っても良い。だけれど、むしろ減らしたほうが手間が省けるし精緻に予想できる)
で、この「補正 R2」なんだけれど、実務家はさほどこの学問的な意味まで知る必要はない! カンタンにだけ述べておくならば、Excelの結果には「重相関 R」「重決定 R2」「補正 R2」ってあるよね? この三つは厳密に説明することはしないけれど、前2つは要素が多くなるほど数値が大きくなる。さっきの例で言えば、「W数」「仕様規定使用年数」「出力数」「温度範囲」に加えてさらにほかの要素を加えると、どんどん「良くなっているように」数値が出ちゃう。だけど、「補正 R2」っていうのは、そこらへんをちゃんと考えられたものだから、当数値が高いほど優れているんだ。
<クリックすると拡大できます>
自由度調整済寄与率とか言い方をするんだけれどね。まあ、それでも、この「重相関 R」「重決定 R2」「補正 R2」はそこまで覚えなくてもオーケー。
今回は複数の要素がある場合の分析と、そして要素を減らして精度を高める方法をお伝えした。
(つづく)