2014/04/29

相関と因果

先週聴いてきたビッグデータ関連のカンファレンスで、何度となく繰り返されていた言葉に「相関と因果」があった。

ビッグデータを高速に処理することが容易になったことで、サンプルデータで一部の相関を調べていた時代から、全データのすべての項目の相関を調べることができるようになってしまった、と。

病院ではビッグデータを生み出している一方で、現場はスモールデータ、ミニデータで格闘していることが多い(エクセルで十分。下手をすると電卓で十分なレベルのことも)。

以前、とある病院で、「病床利用率と入院1日単価の関係性を調べたら、正の相関があった」と報告を受けたことがある。その相関関係を見た分析手法は、半年ほどの月次の利用率と単価の折れ線グラフで、何となく似ている、というレベルだった。

相関関係はあったのかもしれないが、そこからどのような因果関係を導き出せるのだろうか。また、病院の課題は解決できるのだろうか。現場で困ってしまう、ありがちなパターンだ。

この「とある病院」の課題は、『どうやったら病床利用率が上がるか』なのだが、もちろん「単価を上げましょう」は答えにならない。

単価はケースミックスに依存していることが多く、利用率は予定入院や救急搬送などの入院動向と退院動向に影響を受ける。それぞれの依存関係を考えるならば、無理に在院日数を延ばそうとすると単価は低下する傾向にあることくらいだ。つまり、ケースミックスを変えず、単価を上げようとすると早期退院を促す結果、病床利用率は下がるに違いない。

このケースでは、診療科や病棟別の病床利用率などを細かく(ビッグデータと戦っている人からすると、非常に単純な分析)見ていくことで、利用率を上げていく糸口(利用率が上がらない課題の真因)が見えてきたのだが、戦略のないスモールデータとの格闘ほど意味のないものはない。

ビッグデータで世の中が騒いでいるだけに、病院など医療の現場も、データ蓄積・分析の重要性が高まってくるだろうが、まずは基本的なところから、だ。

ちなみに、相関と因果については、上述のセミナーでも下記書籍が何度も引用されていた。自分も以前読んだが、非常に良い本だと思う。

余談だが、病院で出会う多くの人に進めたい本はこっちだ。(まだ読んでないのだが、著者の西内氏の話を聞いた感じでは、万人向けになっていると思われる)