法律コンビニ!街の法律家として皆様のお役に立ちたい。

行政書士とデータサイエンティスト15

統計には「平均への回帰」という現象がある。

「平均への回帰」とは、簡単に説明すると、背が非常に高い父親の息子はそれほど背が高くない傾向があるということである。

 平均への回帰が何代も続くとやがて身長が平均値に収束してしまうように思われるが、身長の中庸の父親からも、非常に背の高い子供が育つというばらつきを大きくする変化も同時におこるからである。結局、分布は安定することになるのである。

 相関があれば予測に用いることができるが、相関をそのまま因果的に解釈することはできない。見かけの相関があるからである。

 見かけの相関とは、チョコレート消費量とノーベル賞獲得数の散布図を作成するとチョコレート消費量とノーベル賞獲得数はかなり強い相関があるよう思われるが、チョコレート消費量を増やせばノーベル賞獲得数を増やすことができる考えるのは無理がある。

 チョコレート消費量とノーベル賞獲得数に相関の背後にあるのは経済文化状況の影響による見せかけの相関なのである。見せかけの相関を生じさせる要因を「交絡因子」と呼んでいる。相関係数を因果的に解釈する場合は「交絡因子」を考慮しなければならない。

2022/5/7