Mediation analysis(中間因子解析)の解説をします。
臨床研究でも時々見かけるようになりました。理論をマスターすれば、簡単に応用可能です。
第1段、Traditional approachについてです。
これは簡単ですが、いわゆるcausal mediation analysisの基礎となります。
*研究者向けの記事です
Mediation analysisとは?
以下、暴露因子をA、中間因子をM、アウトカムをYとします。
例えば、Aは遺伝子変異、Mは喫煙、Yは肺がんです。
mediation analysisとは、
「A→Yの因果関係において、A→M→YというMを仲介するeffectはどれくらいか、A直接YというMを仲介しないeffectはどれくらいか」
ということを定量化する手段です。
今や色々なアプローチが開発されていますが、これらを初見で理解するのはとても難しい。
そこで、ブログ記事で、これらを解釈する手がかりをお伝えできればと思います。
*regression, causal inferenceの基本がわかっている前提での記事です。
Difference methodとproduct method
AとM、MとY、AとYの交絡因子をCとします。
(それぞれC1, C2, C3なら、それらを全て含むのがCです)
すると、以下のような3つのregressionが書けます。
*exchangeabilityと consistencyが成り立つとします
・A→M: E[M|A=a, C=c] = β0 +β1*a +β2*c
…このβ1がA→Mのcausalityです
・A→Y: E[Y|A=a, C=c] = φ0 +φ1*a +φ2*c
…このφ1がA→Y全体のcausalityです
・M→Y: E[Y|A=a, M=m, C=c] = θ0 +θ1*a +θ2*m +θ3*c
…このθ1がA→Y(Mを介さない)のcausalityです
…このθ2がM→Yのcausalityです
これがわかると、すぐです。
今知りたいのは「A→Yのcausationのうち、どれくらいが直接A→Yで、どれくらいがA→M→Yか」ということなのでした。
✅A→Yの全体はφ1。
Mを介さないA→Yはθ1。
じゃあA→M→Yはφ1-θ1!!!
というのが「difference method」。
✅A→Mはβ1。
M→Yはθ2。
じゃあA→M→Yはβ1*θ2!!!
というのが「product method」。
以上です。
Traditional methodの問題は?
一番大きな、根本的な問題があります。
それは、A*Mというinteractionを考慮できないこと。
→A*Mという項をregressionに入れたとしても、そのcoefficientをどう扱えばよいか、わかりませんね。
→これがcausal mediation analysisのmotivationとなります。
また、上のregressionではMとYを連続変数と定義しています。
しかし、もし0-1のカテゴリー変数だったら?
→coefficientの解釈がodds ratioとなってしまいます(logistic regressionを用いた場合)。
→ORを掛け合わせたり引いたりすることはできません
→product methodやdifference methodを計算できません。。。
ということで、causal mediation analysisを学ぶ必要性が出てきました。
続く。
ではまた。