中間因子解析 (mediation analysis)の概念を理解する

中間因子解析は、疫学研究ではそれなりにみるものですが、臨床研究はあまりみません。

これは、「ある因子が、暴露因子→アウトカムという因果関係をどれくらい仲介しているか」という解析手法です。

突き詰めると複雑ですが、Counterfactualの概念がわかっていれば、大まかな構造は理解できます。

中間因子解析ができると、書ける論文の幅がかなり広がります。

ではみてみましょう。

 

 

中間因子解析 (mediation analysis)の概念を理解する

中間因子解析 (mediation analysis)の概念を理解する

Meditationではありません。Mediationです。

 

スタチンを飲むとLDLコレステロールが下がる。

また、スタチンを飲むと心筋梗塞のリスクが減る。

では、スタチンを飲むことによる心筋梗塞リスク低下は、どのくらいLDLコレステロール低下によるのか?

というのを知るのが中間因子解析です。

*「LDLの低下」を「中間因子」と言います。

*中間因子が連続変数だと解釈が難しいので、以下全部0-1のカテゴリー変数として考えていきます。

 

以下、簡便のため、スタチン vs プラセボにランダム化された状況を考えます。

(観察研究であれば、交絡因子で調整すればOKです)

 

例えば、ロジスティック回帰で

・心筋梗塞発症の有無=スタチンの有無

というモデルで、「スタチン→心筋梗塞」の因果効果がわかります。

 

これを中間因子で調整してみましょう。

・心筋梗塞発症の有無=スタチンの有無+LDL低下

このモデルでスタチンの有無のβの解釈は、

「LDL低下の有無(状況)が同じだと考えた時に、スタチンvsプラセボの心筋梗塞リスクの違い」

となります。

言い換えると

LDL低下に関係なく、スタチン単独の効果で心筋梗塞リスクはどれくらい減るか

ということになるので、中間因子解析ができている気がします。

 

実はこれは、中間因子で媒介されていない因果効果(direct effect)を示しています。

では仲介された効果(indirect effect)はというと、最初のモデル

・心筋梗塞発症の有無=スタチンの有無

で得られる「スタチン→心筋梗塞」の因果効果との比較で求められます。

(詳細な式は省きます)

 

次なる疑問。

単純に中間因子で調整すればOKなのでしょうか??

 

 

やっぱりCounterfactualの概念が必要なことも

上記の、中間因子で調整したモデルで暴露因子→アウトカムの関連をみる解析。

これはControlled direct (indirect) effectを推定する方法です。

controlled direct effectは中間因子を介さない効果、

controlled indirect effectは中間因子を解する効果です。

これはこれでれっきとした中間因子解析です。

 

この方法は、

「中間因子も暴露因子に影響されるでしょ」

という事実を考えていません!!!!

 

つまり、スタチン or プラセボでLDL低下効果は違うのに、「LDL低下効果が同じだったら」という調整をしてスタチン→心筋梗塞の関連性を見るのは正しいのか?

という疑問です。

 

これを考慮した解決策は以下のような指標となります:

direct effect:「プラセボを内服していたとして期待されるLDL低下」で調整された、スタチン→心筋梗塞の効果

indirect effect:「スタチンを内服していたとして期待されるLDL低下」で調整された、スタチン→心筋梗塞の効果

ということになります。

これこそがCounterfactualの概念を用いた中間因子解析で、上がnatural direct effect, 下がnatural indirect effectと言われます。

 

 

Causal mediation analysisの概念を記号を使って解説してみる

この方がわかりやすいです(わかれば)。

Aを暴露因子、Mを中間因子、Yをアウトカムとします。

復習ですが、

Ya=1というのが、もし全員A=1(暴露因子有り)だった時のアウトカムでした。

上付き文字はCounterfactualを表します(復習はこちら)。

 

さて、controlled direct effectというのは、

Ya=1, m=0 とYa=0, m=0 の差

ということになります。

暴露因子ありだけど中間因子はなしという状況のCounterfactual outcomeです。

同様controlled indirect effectは

Ya=1, m=1 とYa=0, m=1 の差

です。

 

✔ではnatural direct effectは?というと、

Ya=1, M(a=0)とYa=0, M(a=0)との差です。

*M(a=0)とは、Ma=0と同じ。Counterfactualです。

→つまり「もしA=0(暴露因子なし)だったとしたときのM(中間因子)の状況(Counterfactual)」ということになります。

Counterfactualの中にCounterfactualがあるのです!!

「もしA=0だったときのM」だったとした時のYを、もしA=0だったときのものともしA=1だったときのもので比較しているのです。

 

natural indirect effectは、

Ya=1, M(a=1)とYa=0, M(a=1)との差です。

「もしA=1だったときのM」だった時のYを、もしA=1だったときのものともしA=0だったときのもので比較している。

 

*注意点は、「A=1の人」と「A=0の人」を比較しているわけではないということ。それだったら「|A=1」であり、counterfactualではないのです。

あくまで「もしA=1だったら」。当然実際A=1の人も含んでの、counterfactualです。

 

 

まとめ

コンセプトを理解頂けたでしょうか?

まとめると、

・中間因子=0としたときの解析がcontrolled direct effect

・「中間因子がA=0だったときの結果」と仮定した時の解析がnatural direct effect

というわけです。

 

***

causal mediation analysisの概念、理解できたでしょうか?

詳細な計算はRのpackageがやってくれます。medlexがおすすめです。

ではまた。

-疫学・臨床研究

Copyright© Riklog , 2020 All Rights Reserved Powered by AFFINGER5.