この記事では、中間因子解析=mediation analysisを徹底解説します!
実に単純なものから、counterfactualを考えた複雑なものまで。完全網羅しました。
この記事さえ読めば、mediation analysisに関してかなり深いところまで理解できた事になります。
大ボリュームなので、一気に読まないように注意ください・・・・。
(目次参照ください)
Contents
第1章: 中間因子解析 (mediation analysis)の概念を理解する

Meditationではありません。Mediationです。
第1章はoverviewです。
中間因子解析は、疫学研究ではそれなりにみるものですが、いわゆる臨床研究はあまりみません。
「ある因子が、暴露因子→アウトカムという因果関係をどれくらい仲介しているか」を定量的にみる手法。
突き詰めると複雑ですが、Counterfactualの概念がわかっていれば、大まかな構造は理解できます。
中間因子解析ができると、書ける論文の幅がかなり広がります。
*厳密ではありません。だいたいの感覚をつかんでください。
中間因子解析 (mediation analysis)の概念を理解する
スタチンを飲むとLDLコレステロールが下がる。
また、スタチンを飲むと心筋梗塞のリスクが減る。
では、スタチンを飲むことによる心筋梗塞リスク低下は、どのくらいLDLコレステロール低下によるのか?
というのを知るのが中間因子解析です。
*「LDLの低下」を「中間因子」と言います。
*中間因子が連続変数だと解釈が難しいので、以下全部0-1のカテゴリー変数として考えていきます。
以下、簡便のため、スタチン vs プラセボにランダム化された状況を考えます。
(観察研究であれば、交絡因子で調整します)
例えば、ロジスティック回帰で
・心筋梗塞発症の有無 ~ スタチンの有無
というモデルで、「スタチン→心筋梗塞」の因果効果がわかりますね。
これを中間因子で調整してみましょう。
・心筋梗塞発症の有無 ~ スタチンの有無+LDL低下
このモデルで、「スタチンの有無」の回帰係数の解釈は、
「LDL低下の有無(状況)が同じだと考えた時に、スタチンvsプラセボの心筋梗塞リスクの違い」
となります。
言い換えると
「LDL低下に関係なく、スタチン単独の効果で心筋梗塞リスクはどれくらい減るか」
ということになるので、中間因子解析ができている気がします。
実はこれは、中間因子で媒介されていない因果効果(direct effect)を示しています。
では仲介された効果(indirect effect)はというと、最初のモデル
・心筋梗塞発症の有無 ~ スタチンの有無
で得られる「スタチン→心筋梗塞」の因果効果との比較で求められます。
(詳細な式は省きます)
次なる疑問。
単純に中間因子で調整すればOKなのでしょうか??
やっぱりCounterfactualの概念が必要なことも
上記の、中間因子で調整したモデルで暴露因子→アウトカムの関連をみる解析。
これはControlled direct (indirect) effectを推定する方法です。
✅controlled direct effectは中間因子を介さない効果、
✅controlled indirect effectは中間因子を解する効果です。
これはこれでれっきとした中間因子解析です。
しかしこの方法は、
「中間因子も暴露因子に影響されるでしょ」
という事実を考えていません!!!!
つまり、スタチン or プラセボでLDL低下効果は違うのに、「LDL低下効果が同じだったら」という調整をしてスタチン→心筋梗塞の関連性を見るのは正しいのか?
という疑問です。
これを考慮した解決策は以下のような指標となります:
Direct effect:「プラセボを内服していたとして期待されるLDL低下」で調整された、スタチン→心筋梗塞の効果
Indirect effect:「スタチンを内服していたとして期待されるLDL低下」で調整された、スタチン→心筋梗塞の効果
ということになります。
これこそがCounterfactualの概念を用いた中間因子解析で、
上がNatural direct effect (NDE)
下がNatural indirect effect (NIE)
と言われます。
Causal mediation analysisの概念を記号を使って解説してみる
実はこの方がわかりやすいのです(わかれば)。
<<復習>>
Aを暴露因子、Mを中間因子、Yをアウトカムとします。
Ya=1というのが、もし全員A=1(暴露因子有り)だった時のアウトカムでした。
上付き文字はCounterfactualを表します。
✅Controlled direct effectというのは、
Ya=1, m=0 とYa=0, m=0 の差
ということになります。
「暴露因子ありだけど中間因子はなし」という状況のCounterfactual outcomeですね。
さて。
✅Natural direct effectは?
Ya=1, M(a=0)とYa=0, M(a=0)との差です。
*M(a=0)とは、Ma=0と同じ。Counterfactualです。
→つまり「もしA=0(暴露因子なし)だったとしたときのM(中間因子)の状況(Counterfactual)」ということになります。
→Counterfactualの中にCounterfactualがあるのです!!
「もしA=0だったときのM」だったとした時のYを、もしA=0だったときのものともしA=1だったときのもので比較しているのです。
✅Natural indirect effectは?
Ya=1, M(a=1)とYa=0, M(a=1)との差です。
「もしA=1だったときのM」だった時のYを、もしA=1だったときのものともしA=0だったときのもので比較している。
*注意点は、「A=1の人」と「A=0の人」を比較しているわけではないということ。
→それだったら「|A=1」であり、counterfactualではないのです。
→あくまで「もしA=1だったら」。当然実際A=1の人も含んでの、counterfactualです。
第1章まとめ
コンセプトを理解頂けたでしょうか?
まとめると、
・中間因子=0としたときの解析がcontrolled direct effect
・「中間因子がA=0だったときの結果」と仮定した時の解析がnatural direct effect
というわけです。
以上、第1章、overviewでした。
第2章:Traditional approach
第2章より、Mediation analysisの具体的な方法論を解説していきます。
理論をマスターすれば、簡単に応用可能です。
第1段、Traditional approachについて。
これは簡単ですが、いわゆるCausal mediation analysisの基礎となります。
以下、暴露因子をA、中間因子をM、アウトカムをYとします。
そして、AとM、MとY、AとYの交絡因子をCとします(それぞれC1, C2, C3なら、それらを全て含むのがCです)。
例えば、Aは遺伝子変異、Mは喫煙、Yは肺がん、Cは人種です。
Mediation analysisとは、
「A→Yの因果関係において、A→M→YというMを仲介するeffectはどれくらいか」
「A→直接→YというMを仲介しないeffectはどれくらいか」
ということを定量化する手段でした。
*これより、regression, causal inferenceの基本がわかっている前提です。
Difference methodとproduct method
A, M, Y, Cについて、以下のようなregressionが立てられます。
これが肝ですよん
・A→M: E[M|A=a, C=c] = β0 +β1*a +β2*c
…このβ1がA→Mのcausalityです
・A→Y: E[Y|A=a, C=c] = φ0 +φ1*a +φ2*c
…このφ1がA→Y全体のcausalityです
・M→Y: E[Y|A=a, M=m, C=c] = θ0 +θ1*a +θ2*m +θ3*c
…このθ1がA→Y(Mを介さない)のcausalityです
…このθ2がM→Yのcausalityです
これがわかると、すぐです。
今知りたいのは「A→Yのcausationのうち、どれくらいが直接A→Yで、どれくらいがA→M→Yか」ということなのでした。
✅A→Yの全体はφ1。
Mを介さないA→Yはθ1。
じゃあA→M→Yはφ1-θ1!!!
というのが「difference method」。
✅A→Mはβ1。
M→Yはθ2。
じゃあA→M→Yはβ1*θ2!!!
というのが「product method」。
以上です。
Traditional methodの問題は?
一番大きな、根本的な問題があります。
それは、A*Mというinteractionを考慮できないこと。
→A*Mという項をregressionに入れたとしても、そのcoefficientをどう扱えばよいか、わかりませんね。
→これがcausal mediation analysisのmotivationとなります。
普通logicalに考えて、AとMにinteractionありますよね
また、上のregressionではMとYを連続変数と定義しています。
しかし、もし0-1のカテゴリー変数だったら?
→coefficientの解釈がodds ratioとなってしまいます(logistic regressionを用いた場合)。
→ORを掛け合わせたり引いたりすることはできません
→product methodやdifference methodを計算できません。。。
ということで、causal mediation analysisを学ぶ必要性が出てきましたね!!!
以上、第2章、traditional methodについて、でした。
第3章:Causal mediation analysisの概念+用語解説!
さて、ここからcausal mediation analysisに入っていきます。
まずは概念と用語を抑えましょう。
具体的には:total effect, controlled direct effect, pure/total natural direct/indirect effect
これがわかると、causal mediation analysisで何をやっているか、わかるようになります。
以下、Aをexposure, Mをmediator, Yをoutcomeとし、Y(a)などをcounterfactual outcomeとします。
それぞれ0-1のカテゴリー変数とします。
具体例として、Aを遺伝子変異、Mを喫煙、Yを肺がん、と考えましょう。
*例えばPr[Y(a=1)]なら、全ての人がA=1であったと仮定した時のoutcomeの確率、ということを意味します。
→つまり、もし全ての人が喫煙していた時の肺がん発症確率、という意味です。
Mediation analysisでは、
A→Yという全体の効果を、直接A→Yという経路とA→M→Yという経路に分解したい
ということがmotivationなのでした。
✔︎Total Effect (TE)とは?
TEは「A→Yという全体の因果効果」を意味します。
よって、
TE = Y(a=1) - Y(a=0)
です。
以上。
✔︎Controlled direct effect (CDE)
CDEは「もし全員のMが同じ値に設定できたとした時のA→Yの因果効果」です。
これはMを同じ値に設定することにより、直接A→Yという効果を検証しているので、direct effectです。
Mには0と1の可能性があるので、CDEには2種類あります。
CDE(m=0) = Y(a=1, m=0) - Y(a=0, m=0)
CDE(m=1) = Y(a=1, m=1) - Y(a=0, m=1)
です。
以下、natural direct/indirect effectという概念を説明していきますが、難しければCDEだけで十分です。
というのは、natural effectを推定することはそもそも妥当でない、と考える研究者もいるので。
このあたりは第5章で解説しています。
✔︎Natural direct effect (NDE)
NDEは「もし全員のMをA=0だったとした時の状態に設定できたとした時の、A→Yの因果効果」です。
CDEと同じようにMの値に介入するのですが、
・直接Mの値に介入するのがCDEで、
・「A=0という介入の結果みられるMの値」にMを設定するのがNDEです。
これもMを同じ値に設定することにより、直接A→Yという効果を検証しているので、direct effectです。
数式では
NDE = Y(a=1, m=M(a=0)) - Y(a=0, m=M(a=0))
となります。
*ここで、
なんでM(a=0)なのか、M(a=1)に設定してもよいのではないか
と思う方、鋭いです。
「Mを仲介しない」という意味では、どちらも当てはまりそうです。
実は、
・上のNDEはpure NDE
・M(a=1)としたNDEはtotal NDE
と言われます。
この解説はこの第3章後半で行います。
✔︎Natural indirect effect (NIE)
NIEは「Aを一定として、MがA=1とした場合とMがA=0とした場合を比較することによるA→M→Yの効果」です。
これはA→M→Yというpathwayを検証しているのでindirect effectです。
数式の方がわかりやすいかもしれません。
NIE = Y(a=1, m=M(a=1)) - Y(a=1, m=M(a=0))
です。
*NDE同様、なぜY(a=0, m=M(a=1)) - Y(a=0, m=M(a=0))でないのでしょう?
実は、
・このa=0バージョンがtotal NIE
・元のa=1バージョンがpure NIE
という定義です。
✔︎PureとTotal
最後にこの区別。
「A-M interactionの効果を含めたのがTotal, 含めないのがPure」です。
どういうことでしょう?
一般的にA-M Interactionの効果というのは、A=1かつM=1の時初めて認められる効果を言います。
(つまり1 + 1 ≠ 2、ということです)
→今は「Aに介入する」counterfactualを考えています。
→このときinteractionは「A=1かつM(A=1)の時に認められる効果」です。
→つまりY(a=1, m=M(A=1))を含むeffectが、total NDEなりtotal NIEなわけです。
*より詳細には、第7章で説明して行きます。これはeffect decompositionという概念につながっていきます。
✅ここで重要なポイント。
特に断りがない限り、
·NDEとはpure NDEのこと
·NIEとはtotal NIEのこと
です。
*論文などで紛らわしいのは、pure NDEをpure direct effect (PDE)とかとしていること。
→そもそもpure/totalという概念が説明される際には「Natural」という単語は省かれるかもしれません。注意。
TE, NDE, NIEの関係
概念が分かったところで、関係性を見ていきます。
直感的には「TE = NDE + NIE」にならなければなりません。
だってA→Y全体の効果を、Mを介さない+Mを介す効果に分けているわけだから。
これは簡単に証明されます。
・TE = Y(a=1) - Y(a=0)でした。
・NDE = Y(a=1, m=M(a=0)) - Y(a=0, m=M(a=0))ですが、後ろのY(a=0, m=M(a=0))はY(a=0)と同じです。
→なぜなら、A=0に介入したYの結果をみているにすぎないからです。
・NIE = Y(a=1, m=M(a=1)) - Y(a=1, m=M(a=0))ですが、同様に前のY(a=1, m=M(a=1)) = Y(a=1)です。
よって、
NDE + NIE
= Y(a=1, m=M(a=0)) - Y(a=0) +Y(a=1) - Y(a=1, m=M(a=0))
= Y(a=1) - Y(a=0)
= TE
ということでした。
*繰り返しになりますが、ここでのNDE = pure NDEであり、NIE = total NIEです。
Proportion mediated/eliminated
最後に「どれくらいがMを仲介している効果か」という指標を紹介します。
✔︎まずProportion mediated (PM)
これは単純で、
PM = NIE / TE
です。
✔︎そしてproportion eliminated (PE)
これはCDEに基づく指標で、
PE = (TE - CDE) / TE
です。
→CDEはCDE(m=0)とCDE(m=1)の2つがあるので、2つのPEがあります。
*なぜPMとPEがあるのかというと、本当はPMを知りたいけどPMが計算できない状況が多々あるためです。
→これは、NIEとNDEを計算するために必要なassumptionが強烈すぎるためです。
→CDEを求めるためのassumptionは弱いので、
→CDEしか求められない=PEしか求められない場合、というのがあるのです。
第3章まとめ
TE = Y(a=1) - Y(a=0)
CDE(m) = Y(a=1, m) - Y(a=0, m)
(pure) NDE = Y(a=1, m=M(a=0)) - Y(a=0, m=M(a=0))
(total) NIE = Y(a=1, m=M(a=1)) - Y(a=1, m=M(a=0))
これらを求めるのがcausal mediation analysisです。
以上、第3章でした!!!!
第4章:Assumption【超重要】
第4章、中間地点です。
ここではCausal mediation analysisを行うためのassumptionについて見ていきます。
causal mediation analysisは、実はこのassumptionを理解することが一番重要と言っても過言でありません。
計算はソフトがやってくれるので。
今まで通り、exposureをA、mediatorをM、outcomeをYとします。それぞれ0-1の変数。
そしてA-M, M-Y, A-YのconfounderをCとします(それぞれ異なるconfounderのsetですが、それを全て含むsetがCです)。
counterfactualをY(a=1)などと表します。
復習すると、
・Total effect: TE = Y(a=1) - Y(a=0)
・Controlled direct effect: CDE(m) = Y(a=1, m) - Y(a=0, m)
・(pure) natural direct effect: NDE = Y(a=1, m=M(a=0)) - Y(a=0, m=M(a=0))
・(total) natural indirect effect: NIE = Y(a=1, m=M(a=1)) - Y(a=1, m=M(a=0))
でした。
さて、これらは個人での効果ですが、これからは集団での効果(=期待値)を見て行きます。
その上で必要な、それぞれのidentifiabilityのassumptionをみていきましょう。
*identifiabilityとは、上記のcounterfactualから、実際に観測可能な方法で、それぞれの値を求められる、ということです。
→counterfactualは観測されないので、実際に計算するためにはassumptionが必要なのでした。
Total effect
TEは単純にAとYだけの問題なので、
i) AとYの間にunmeasured confounderがない
=Y(a,m) II A | C
が条件となります。
*以下、「II」はindependence, 「| ~」 はconditional ~、を示します(つまりconditional independencyということです)。
このとき
TE = E[Y(a=1) - Y(a=0) | C=c]
= E[Y|A=1,C=c] - E[Y|A=0,C=c]
と求めることができます。
Controlled direct effect
CDE(m)を求めるには、
i)に加えて
ii) MとYの間にunmeasured confounderがない
= Y(a,m) II M | A,C
が条件です。
このとき
CDE(m=m) = E[Y(a=1,m=m) - Y(a=0,m=m) | C=c]
= E[Y|A=1,M=m,C=c] - E[Y|A=0,M=m,C=c]
となります。
以上2つのassumptionは、因果推論の基礎がわかる方には難しくないと思います。
NDEとNIE
さて本題です。
NDEとNIEを求めるには、
i)とii)に加えて
iii) AとMの間にunmeasured confounderがない
=M(a) II A | C
iv) MとYの間のconfounderはAを原因としない
= Y(a=1,m) II M(a=0) | C
という4つのassumptionが必要です。
i)~iv)が成り立つ時、
・NDE = E[Y(a=1,m=M(a=0)) - Y(a=0,m=M(a=0)) | C=c]
= ∑{E[Y|A=1,M=m,C=c] - E[Y|A=0,M=m,C=c]} * P[M=m | A=0,C=c] * P(C=c)
・NIE = E[Y(a=1,m=M(a=1)) - Y(a=1,m=M(a=0)) | C=c]
=∑E[Y|A=1,M=m,C=c] * {P(M=m | A=1, C=c) - P(M=m | A=0, C=c)} * P(C=c)
となります。
*それぞれ∑はm,cに対して
注)NDE, NIEはcross-world counterfactualが成り立つことが前提
以上のassumptionをまとめるとこうなります。
これがとりあえず超重要です。
↓
i) ~ iii)は、A-Y, M-Y, A-Mの間にunmeasured confounderがないということ
iv)はMとYの間のconfounderはAを原因としないこと
で、
CDEはi), ii)のみ
NDEとNIEはi)=iv)
を必要とする
ポイントはiv)です。
これはDAGで書くと非常にシンプルなのですが、実は少し事を単純化しています。
実際に得たいindependenceは
Y(a=1,m) II M(a=0) | C
であり、
実はiv)のassumptionからこのindependenceに至るためにcross-world counterfactualが成り立つことを前提としています。
*cross-worldというのは、Y(a=1,m)は「全員のAを1としたときのcounterfactual」であり、M(a=0)は「全員のAを0としたときのcounterfactual」、と2つの異なるcounterfactualを想定していることを意味します。
これがなぜ問題かというと、2つの異なるcounterfactualを同時に観測することは不可能だからです。
これを成り立つと仮定して話を進めて良いか、理論疫学研究者内でも議論があります。
大きくは、現代の理論疫学の父であるJudea Pearl(UCLA)とJames Robins(ハーバード)の間で考え方が違うのです。
この2人の考え方の違いを理解するのは少し難しいですが、基本的にはCross-world counterfactualについて
・Robinsは「成り立つと仮定してはいけない」
・Pearlは「成り立つと仮定して良い」
と考えています。
当然RobinsはNDEやNIEをそもそも計算することに反対なわけです。
これは次の第5章で、少し深掘りして解説していきます。
以上、第4章、causal mediation analysisのassumptionについてでした!!!!!!!!!!!
第5章:Cross-world counterfactualの妥当性【Skip可】
Cross-world counterfactualは妥当なassumptionなのか。
第4章で、理論疫学者の中でも論争があると書きました。その詳細です。
少し難しい話ですが、興味ある方がいるかと思い、まとめて見ました。
注:興味ない方はSKIP可能です!
これを理解できれば、理論疫学の基本の考え方について自信を持って良いと思われます。
今まで通り、exposureをA、mediatorをM、outcomeをYとします。それぞれ0-1の変数。
counterfactualをY(a=1)などと表します。
cross-world counterfactualの問題とは、
E[Y(a=1, m=M(A=0)] を考える事が妥当か
ということです。
→これはA=1とA=0という2つの異なる介入の結果であり、現実世界で観測することはできないから、問題なのでした。
例えばE[Y(a=1) - Y(a=0)]であれば、Aをランダムに割り振るRCTで求めることができます。
….当然A=1の群でE[Y(a=1)]、A=0の群でE[Y(a=0)]が観測されますね。
(ここでAがRCT可能なexposureか、ということは置いておいています。そういう問題ではありません)
しかしE[Y(a=1, m=M(A=0))]とはA=1かつA=0で介入された人しか観測され得ず、そんなことはどうやっても現実で観測不可能です。
一方、cross-world counterfactualを妥当と考えないと、natural direct effectなどを計算できない。
そもそもNDEとかって、意味あるの???
という問題。
簡単にいうと、
妥当と考えて良い派:Judea Pearlの一派
妥当と考えて良くない派:James Robinsの一派
です。
****
Robins(ハーバード)は、実際の疫学研究によって因果関係を確かめることを到達地点として、因果推論の理論を構築してきています。
Natural direct effectというどんな疫学研究によっても測定することができないパラメーターは、そもそも研究対象とすることが誤りだ、という強い主張なのです。
ちなみに、この学派では「exposure=intervention」であり、この定義についてはかなりstrictです。
・例えば「BMI<30kg/m2」というexposure(肥満を想定しています)は、not well-defined=ダメダメ、とされてしまいます。
なぜなら「BMIを30未満/以上にする」という介入は不可能だから。
→一瞬でBMIが変わる方法なんてありませんね。
よって、例えば観察研究においても、「1年でBMIが5減った」というexposureを考えるように指導されます
→これなら、「1年でBMIが5減る」ような介入が可能だからで、そういうRCTを行えば、そのcounterfactualの結果が観察可能だからです。
一方Pearlは違ったスタンスかと思われます(直接習った事はありませんが)。
実はこの2人は、異なるcausal modelを想定しているのです。
少し難しいですが、論争の歴史を振り返って学んで見ましょう。
*以下の解説はRobinsの授業に基づくので、少しバイアスがかかったものかもしれません。
NPSEMとFFRCISTG
✔︎Pearlのモデル:NPSEM
注) 最初に言っておくと、PearlもRobinsもとても頭が良いのですが、物事に名前をつけるということに関しては非常に下手です。
ご了承ください。
まずPearlが想定していたモデルは
Non-parametric structural equation model (with independent errors)
というもので、NPSEMと略します。
これは、(causal) DAGに表されるものは、non-parametricなモデルで因果関係を表した時、そのモデルのerror termはindependentである、という主張です(DAGが正しければ)。
✔︎Robinsのモデル:FFRCISTG
一方Robinsはこのようなモデルを考えていました:
Finest fully randomized structural causally interpretable tree graph model
略してFFRCISTGです
(なが)
これは、(causal)DAGは基本的に仮想のRCTを図式化したもので、RCTに基づく因果関係として解釈可能だ、とする主張です。
****
Robinsのモデルは「no causation without manipulation」というスローガンを軸にしています。
このスローガンは昔からあるもので、つまり机上の論理だけで因果関係を推論することは意味がない、という主張です。
→cross-world counterfactualを元にするnatural direct effect等は、manipulable parameterでないので、そもそもそれらを考えることが妥当でない、と考えます。
*なお、Pearlはこれに対し「causation before manipulation」という別のスローガンを掲げています。なぜこう言っているかは、この記事でわかります。
なぜ「no causation without manipulation」?
これは明快です。
実際の研究によって確かめられることがなければ、「NDE=1.4だ!」というような主張を確かめることができないから。
確かめるすらできないなら、適当な事を言っても真偽は闇の中。
→それは科学とは言えない、というスタンスです。
なお、これに対し「そもそも、特に観察研究の因果推論のassumptionは強力すぎて現実味がなく、その点で実際の疫学研究で検証できない因果関係は星の数ほどあるのでは?」という批判があります。
→FFRCISTGでは、「そもそもhypotheticallyに疫学研究デザインを考えうるか」ということを重視しています。
→以下の議論も、「どういうデザインであれば観測しうるか」がポイントになります。
E[Y(a=1, m=M(A=0))]は観測可能!?!?
「causation before manipulation」というのはある種絶対的なスローガンであり、ふつーに考えるとcross-world counterfactualは観測不可能です。
しかし、Pearlは以下のような話で、Natural direct effectは実用的に重要な概念だ、と主張したようです。
これが大変興味深いので、是非理解してみてください。
*****
Exposure=禁煙、mediator=高血圧、outcome=心筋梗塞、とし、exposureはランダム化されているとします。
禁煙 (A)→心筋梗塞 (Y)の因果効果が、高血圧 (M)を介するか(indirect effect)介さないか (direct effect)を知りたい。
ここからがポイントですが、
・タバコに含まれるニコチンが高血圧の原因となる
・タバコに含まれる他の物質は高血圧の原因とならない
と仮定できるとします。
→こう仮定すると、「ニコチンのみ除去されたタバコ」へ替えた場合の心筋梗塞への影響とは、元のモデルでいうnatural direct effectになりますね!!!!!!
(ニコチンがない=高血圧への効果がない、だから)
詳しくは、
・natural direct effect (NDE)とはE[Y(a=1, m=M(a=0)) - Y(a=0, m=M(a=0))]でしたが、
・後半のE[Y(a=0, m=M(a=0))] = E[Y(a=0)] であり、これはexposureをランダム化すれば観察可能。
・前半のE[Y(a=1, m=M(a=0))] はcross-world counterfactualで観察不可能かと思われましたが、
→「ニコチンのみ除去されたタバコに替える」という介入をランダム化すればこれが観察可能になる、ということです。
そして更に、
・2年後に、タバコからニコチンのみを除去する技術が開発される
と大胆に仮定します。
これらの仮定に基づけば、2年後にはNDEの効果が判定できるようになる、ということになります。
あれ????
FFRCISTGモデルでもNDEを計算できる!?
Robinsの提唱するFFRCISTGモデルは、g-formulaという考え方が基本にありますが、これを知らずとも、基本的な確率とcounterfactualの原理を知っていればわかります。
ここはやや数学的なので、苦手な方は読み流して大丈夫です。
上のstoryに沿って、次のようなDAGを考えます。
exposureであるAがN(ニコチン)とO(その他)に分かれます。
NだけがMの原因となります。
ここで
「a=1, m=M(a=0)というcounterfactual」は「N=0, O=1というcounterfactual」を意味します。
(ニコチンのないタバコを吸っている、という意味です)
よって
E[Y(a=1, m=M(a=0))] = E[Y(n=0, o=1)]
これを求めるには、consistencyを使えるよう
E[Y | N=0,O=1]
がわかればよいです。
さて、条件付き確率の定義より、
E[Y | N=0,O=1]
=E[Y | N=0,O=1, M=m] * Pr(M=m | N=0,O=1)
ここで
Y(n,o,m) II N | O,M
M(o) II O | N
というconditional independenceが成り立つので(D-separationでわかります)
E[Y | N=0,O=1, M=m] * Pr(M=m | N=0,O=1)
=E[Y | N=1,O=1, M=m] * Pr(M=m | N=0,O=0)
最後に、今のデータで
・N=1かつO=1ならA=1
・N=0かつO=0ならA=0
なので、
E[Y | N=1,O=1, M=m] * Pr(M=m | N=0,O=0)
=E[Y | A=1, M=m] * Pr(M=m | A=0)
ということで、
OやMの情報なくとも、今あるデータでNDEは求められる、ということになります。
*これはcausal mediation analysisでの式(つまりNPSEMモデルに基づいた式)と同じです。
何が問題か?
さて、FFRCISTGモデルでも無事NDEが求められてしまいましたが、何が問題なのでしょう?
今までの議論で、実は4つ、criticalなassumptionを行なっていたのでした。
i) N(ニコチン)は、必ずM(高血圧)を介してY(心筋梗塞)の原因となる
....すなわち、N→Yという直接の矢印がない、ということです
ii) OはMに影響を与えない
iii) Aは必ずNとOにのみ分解される(deterministic model)
iv) NはM、OはYにのみ影響を与える(他の因子を介さない)
これらはデータからはわからない事で、立証できないわけです。
Pearlの話をFFRCISTGモデルで考えると、そういう仮定をすることはでき、その仮定が合っていればNDEは推定可能、ということになります。
つまりRobinsにとっても、そういう事象が見つかるならOKですが、それはあまりに強すぎるassumptionで全く現実味がない(だからNDEを推定するのは妥当でない)、ということです。。
わかりましたでしょうか??
Controlled direct effectで良いじゃん
結局現実的にはNDEを求める研究をデザインできないので、推定しても確かめることはできず、妥当とはいえない。
それより、AとM両方に介入した結果であるCDEの方が意味がある。
これがFFRCISTGモデルの結論です。
*実際は、あらゆる場合のDAGを想定し、NDEが推定可能か調べています。例えばこういう論文で解説していますが、かなり難解です
****
実際、NDEを出すためのassumption iv) が満たされない時、CDEを計算するためにFFRCISTGで頻用するg-formulaやMarginal structural modelを使います(time-varying exposureの対処法と同じです)
→これはやや発展的な方法なので、体系的に習った事が無いと、やや敷居の高い方法です
→つまりCDEを計算する事も、それほど単純で無いケースが(結構)ある、ということです。
また、NDEやNIEは机上の論理にすぎないということは広く認知されてきています
⇒それと似たような概念だけどCDEの延長である「Randomized intervantional analogue」というものが使われ始めたりしています。
(また追って解説するかもしれません)
まとめ
NDEやNIEを推定できる、と考えるのはNPSEMモデル。
FFRCISTGモデルではNDEやNIEを推定することは、結局それを得るための疫学研究をデザインできないため、妥当でないと考える。CDEを使うべき。
でもこの議論を芯から理解しようとするのは大変かもしれません。。。。
以上、第5章でした。
第6章:具体的に計算する
mediation analysis第6章、ついにCDE, NDE, NIEを具体的に計算します!!
統計ソフトがやってくれますが、実際に自分の解析に使いたいなら、これを理解することは必須です。
今までの知識が前提となるので、是非この記事の前にご覧ください。
今まで通り、exposureをA、mediatorをM、outcomeをY、confounderをCとします。
counterfactualをY(a=1)などと表します。
勘弁のためAとMは0-1の変数とします。Yは連続値とします。
*Yが0-1の場合は計算式が少し異なります。
Mediation analysisについては、Assumptionが4つあり、それが成り立つ時、
✔︎(pure) NDE = Y(a=1, m=M(a=0)) - Y(a=0, m=M(a=0))
✔︎(total) NIE = Y(a=1, m=M(a=1)) - Y(a=1, m=M(a=0))
でした。
*以下M=mをm, C=cをcと略します。
Regression approach
上のNDEやNIEを求める方法はいくつかありますが、まず基本的なregression approachを紹介します。
以下のような、普通のregressionを考えます。
A→M: E[M|A=a, c] = β0 +β1*a +β2*c
A→Y: E[Y|A=a, m, c] = θ0 +θ1*a +θ2*m +θ3*a*m +θ4*c
*これはexposure*mediatorのinteractionがありますね。traditional methodではこのinteractionを考えることができないのでした。
このとき、
CDE(m) = θ1 + θ3*m
…これはA→Yのregressionからです。aが0→1に動いたときのE[Y|A=a, m, c] の差ですね。
NDE = θ1 + θ3*(β0 + β1*0 + β2*C)
…これはA→Yのregressionでaを0→1に動かした結果です
→a*mのmの部分をA→Mのregressionの結果E[M|A=a, c]に置換したものですね。
NIE = θ2*β1 + θ3*β1
…これはtraditional methodのproduct method + θ3*β1
→θ3*a*mのaに1, mにβ1を代入したものですね。
こうなります。
******
ここで重要なポイントです。
もしA*Mのinteractionがなかったら??
·NDE = θ1 = CDE(m)
·NIE = θ2*β1
となります。
→NIEはproduct methodの結果となり、NDEはCDEと同じとなります!!!!!!!
つまりNDEやNIEは、exposure-mediatorのinteractionを考えるための手段であることが再確認されます。
他のアプローチ
以上がregression approachですが、他にも方法があります。
より良いと思われる方法は、Monte Carlo Approachです。
これはregression approachと同様のモデルなのですが、方法が異なります。
・まず、上の2つのregression modelを作ります
→「A→M」のモデルで「全員A=0」とcodingしたデータセットでpredictし、M(A=0)を計算します
→「A→Y」のモデルに、「全員A=1」かつ上で計算したM(a=0)でpredictします
→これでそれぞれのY(a=1,m=M(a=0))が計算されます
→最後にこれを平均します
これの何がよいかというと、それぞれの参加者に対するNDEやNIEが求められると言うことです。
これによって、0-1のoutcomeに対するNDEやNIEをリスク比として求められるのです。
*regression approachでは、基本的にlogistic regressionにfitすることしか出来ないので、オッズ比しかわかりません。
→outcomeがrareだ、という仮定の下、オッズ比をリスク比に近似するしかないのです
以上、第6章でした。
次、第7章、ラストですよ!!!!!!!
第7章:Effect decomposition【最終章】
いやーーーお疲れ様でした。
最後の7章、Effect decompositionについてです。
Total effectを、様々なeffectに分解する、という意味合いです。
これがわかると、とりあえずcausal mediation analysisを一通り学んだことになるだけでなく、色々繋がってスッキリします!
頑張りましょう!
今まで通り、exposureをA、mediatorをM、outcomeをYとします。それぞれ0-1の変数。
counterfactualをY(a=1)などと表します。
Causal interaction
Effect decompositionのために、まずcausal interactionについて考えます。
一番基本的なinteraction定義は、「どっちもあるとき、片方だけでない効果が認められること」です。
つまり1+1=2にならない事を、interactionといいます。
*これはプラス·マイナスのスケールのinteraction(additive scale)です。
→いわゆるlogistic regressionやCOX proportional modelでのinteractionはmultiplicative scaleのinteractionで、別物です
→しかし重要なのはadditive scaleのinteractionなのでした。
Interactionの詳細はこちら
****
さて、これをcounterfactualで考えましょう。
今、Yに対するAとMのinteractionを考えています。
すると、
「A=0かつM=0」の状態がreferenceであり、これと比較し
「A=1かつM=0」の結果+「A=0かつM=1」の結果が「A=1かつM=1」の結果と同じにならない
ということが「causal interaction」の表現となります。
数式でかけば、
{Y(a=1,m=0)-Y(a=0,m=0)} + {Y(a=0,m=1)-Y(a=0,m=0)} ≠ {Y(a=1,m=1)-Y(a=0,m=0)}
じゃあ「どれくらいinteractionがあるのか」というのは、これらを引けばよく、
Y(a=1,m=0)-Y(a=1,m=0)-Y(a=0,m=1)+Y(a=0,m=0)
となります。
これがcausal interactionの量です。
Effect decomposition
Total effect (TE) = Y(a=1) - Y(a=0) = Y(a=1,m=M(a=1)) - Y(a=0,m=M(a=0))
を分解したいのです。
証明の詳細は論文に譲りますが、結果から言うとこういう式にになります:
TE
= Y(a=1,m=0) - Y(a=0,m=0)
+ {Y(a=1,m=0)-Y(a=1,m=0) - Y(a=0,m=1)+Y(a=0,m=0)} * M(a=0)
+ {Y(a=1,m=0)-Y(a=1,m=0) - Y(a=0,m=1)+Y(a=0,m=0)} * {M(a=1)-M(a=0)}
+ {Y(a=0,m=1)-Y(a=0,m=0)} * {M(a=1)-M(a=0)}
一見意味不明です。
が、これに解釈を与えることができる、というのがポイントなのです。
*****
言葉で書くとこうなります:
TE
= controlled direct effect
+ もしA=0の時M=1だったらcausal interaction(referent interactionと言います)
+ もしA→Mの効果があったらcausal interaction(mediated interactionと言います)
+ pure natural indirect effect (*いわゆるNIE=total NIEではありません)
なぜこれが面白いかというと、さらに式変形できるから。
✔︎CDE + referent interaction = pure NDE
✔︎mediated interaction + pure NIE = total NIE
なのです!!!!
*そもそもTE = pure NDE + total NIEでしたね
*****
噛み砕いていえば、こうなります:
CDEとは:direct effectでありcausal interactionを介さない部分
referent interactionとは:direct effectでinteractionを介す部分
mediated interactionとは:mediated effectのinteractionの部分
pure NIEは:mediated effectのinteractionを介さない部分
面白いですね!!!
*(referent interaction + mediated interaction) / TE
を「proportion attributable to interaction (PAI)」とも言います
これでお終いです
ここになって、ようやくpure/total NDE/NIEが結びついてきました。
pureというのは「causal interactionの影響がない」という意味が含まれていたのでした。
ここまでの事がわかれば、causal mediation analysisが何たるか、基本が理解できたことになります。
ただ、やはりNDEとNIEを求めるための4つのassumptionは成り立つ場面が少なく(ほとんどなく)、かつcross-world exchangeabilityが成り立たないと考える研究者がいるので、そもそもこういった指標を使うべきかはよく考える必要があります。
CDEを使うことに関しては、そこまで問題になりません。
mediation analysis、理解できたでしょうか?
マジでお疲れ様でした。
ではまた。