因果関係と相関関係の区別は、簡単なようで迷うこともあるかもしれません。
残念ながら、因果関係と相関関係をはっきりさせない(詐欺)情報は、世の中に腐るほどはこびっています。
この2つをしっかり区別できるようになることは、信頼できる情報を自分で選択できるようになるため、必須のヘルスリテラシーです。
あえてわかりにくい表現をされているものもあるので、この記事ではこれらを見分けるポイントを説明しました。
因果関係と相関関係の決定的な違い

「お酒を飲む人は死亡率が高い」は相関関係。
「お酒を飲むと死亡率が高くなる」が因果関係。
だいたい、ほとんどの主張は、「〇〇が☓☓に関連するか(の原因となるか)」というスタイルです。
*疫学や因果推論では〇〇を暴露因子(exposure)、☓☓を結果(outcome)といいます。
因果関係と相関関係の決定的な違いは、相関関係は「その情報に原因・結果という意味を含んでいない」ことにあります。
だから、相関関係は、あんまり情報として意味がありません。
→お酒を飲む人が死亡率が高いだけ。死亡率が高いのはお酒の影響かはわからない。
→じゃあどうすればよいか(酒を飲まないほうがよいのか)、と言えないのです。
より具体的にみていくと、「実はお酒を飲む人はタバコをよく吸うから、タバコによって死亡率が高い」のかもしれません。
→そう考えると、お酒を控えても死亡率には影響しないわけです。
→だから、相関関係の情報はあんまり意味がない。
一方、因果関係であれば、お酒が死亡の原因であるわけだから、お酒を控えたらよい、ということになります。
皆が欲しい情報は因果関係。
でも因果関係を証明するのはとてもむずかしいのです。
因果関係を証明する根本的な考え方
酒が死亡の原因だというためには、あなたが2人いたとして、1人は酒を飲む、1人は酒を飲まないとしたとします。
もし、酒を飲んでいるあなたが10年後には死亡していて、酒を飲まないあなたが生きていたとしたら、酒が原因で死亡した、と言えますね。
→因果関係が言及できた、というわけです。
でもあなたは2人いません。どうすればよいのでしょうか。
最も簡単かつ強力な方法は、ランダム化試験です。
10000人くらい集めて、コインの表がでたら10年間酒を飲む、裏がでたら10年間酒を飲まない、と決めます。すると、5000人くらいずつの2集団ができます。
もしお酒を飲む集団の方が死亡率が高ければ、酒が原因で死亡率が上がった、ということができるでしょう。
→因果関係が言えました。
ちょっと立ち止まってみましょう。
では、なぜランダム化試験で因果関係が言えたのでしょうか。
→それは、比較する集団がだいたい(平均して)同じ特性を持っているからですね。あなたは2人いませんが、10000人くらい集めれば、飲酒グループと禁酒グループの性質はだいたい同じくらいになります。
→すると、違いは飲酒の有無だけということになります。
大事なので繰り返すと、比較する集団がだいたい同じなら(フェアな比較なら)、暴露因子とアウトカムの因果関係が言えます。
逆に、比較する集団の性質が同じ様でないと、因果関係ではなく相関関係を意味します。
こういうのは全部嘘の因果関係(相関関係に過ぎない)
因果関係を追求することは、ランダム化試験を行ったり、色々と手間がかかります。
なので、因果関係が分かっている事象というものは、概して少ないのです。
例えば、こういうのは全部相関関係です。
「2ちゃんねるが出てきてからネット関連の犯罪が増えた」
→にちゃんねるがある前と後で、世の中の状況は違います。フェアな比較でありません。
「〇〇塾は東大合格500人!〇〇塾にいけば東大に受かる」
→〇〇塾に行っている人が、行っていない人と比較して、ただ賢いだけかもしれません。授業の質の違いでなく。
→フェアな比較でありません。
「チョコレートを食べると糖尿病になる」
→あなたの周りの糖尿病の方がチョコレートを食べているからといって、チョコレートが原因とは言えません。チョコレートを食べながら糖尿病でない人もいます。
→科学的根拠として、チョコレートは糖尿病の罹患リスクを下げるかもしれません(Nutrients. 2017;9(7):688.)。
騙されないようにしましょう。
その比較はフェアか。
***********
また、「〇〇したらやせた!!」というのは個人の経験です。
個人を対象にしている時点で、因果関係は当然わかない上に、相関関係すらわかりません。
*相関関係がわかるには集団の情報が必要ですね。
つまり情報量ゼロです。
騙されないで下さい。
結論
比較する集団の性質が同じくらいであれば、相関関係=因果関係となります。それ以外の場合は、因果関係を言えません。
どんな広告も因果関係を強調していますので、気をつけましょう。
ではまた。