中間因子解析その3:assumption【重要】

Mediation analysis解説、3段

ここではCausal mediation analysisを行うためのassumptionについて見ていきます。

causal mediation analysisは、実はこのassumptionを理解することが一番重要と言っても過言でありません。

計算はソフトがやってくれるので。

 

Causal mediation analysisのassumption

Causal mediation analysisのassumption

今まで通り、exposureをA、mediatorをM、outcomeをYとします。それぞれ0-1の変数。

そしてA-M, M-Y, A-YのconfounderをCとします(それぞれ異なるconfounderのsetですが、それを全て含むsetがCです)。

counterfactualをY(a=1)などと表します。

 

復習すると、

・Total effect: TE = Y(a=1) - Y(a=0)

・Controlled direct effect: CDE(m) = Y(a=1, m) - Y(a=0, m)

・(pure) natural direct effect: NDE = Y(a=1, m=M(a=0)) - Y(a=0, m=M(a=0))

・(total) natural indirect effect: NIE = Y(a=1, m=M(a=1)) - Y(a=1, m=M(a=0))

でした。

 

さて、これらは個人での効果ですが、これからは集団での効果(=期待値)を見て行きます。

その上で必要な、それぞれのidentifiabilityassumptionをみていきましょう。

 

*identifiabilityとは、上記のcounterfactualから、実際に観測可能な方法で、それぞれの値を求められる、ということです。

→counterfactualは観測されないので、実際に計算するためにはassumptionが必要なのでした。

 

 

Total effect

TEは単純にAとYだけの問題なので、

i) AとYの間にunmeasured confounderがない

  Y(a,m) II A | C

が条件となります。

*以下、「II」はindependence, 「| ~」 はconditional ~、を示します(つまりconditional independencyということです)。

 

このとき

TE = E[Y(a=1) - Y(a=0) | C=c] 

= E[Y|A=1,C=c] - E[Y|A=0,C=c]

と求めることができます。

 

 

Controlled direct effect

CDE(m)を求めるには、

i)に加えて

ii) MとYの間にunmeasured confounderがない

 = Y(a,m) II M | A,C

が条件です。

 

このとき

CDE(m=m) = E[Y(a=1,m=m) - Y(a=0,m=m) | C=c]

= E[Y|A=1,M=m,C=c] - E[Y|A=0,M=m,C=c]

となります。

 

以上2つのassumptionは、因果推論の基礎がわかる方には難しくないと思います。

 

 

NDEとNIE

さて本題です。

NDEとNIEを求めるには、

i)とii)に加えて

iii) AとMの間にunmeasured confounderがない

 =M(a) II A | C

iv) MとYの間のconfounderはAを原因としない

 = Y(a=1,m) II M(a=0) | C

という4つのassumptionが必要です。

 

i)~iv)が成り立つ時、

・NDE = E[Y(a=1,m=M(a=0)) - Y(a=0,m=M(a=0)) | C=c]

= ∑{E[Y|A=1,M=m,C=c] - E[Y|A=0,M=m,C=c]} * P[M=m | A=0,C=c] * P(C=c)

・NIE = E[Y(a=1,m=M(a=1)) - Y(a=1,m=M(a=0)) | C=c]

=E[Y|A=1,M=m,C=c] * {P(M=m | A=1, C=c) - P(M=m | A=0, C=c)} * P(C=c)

となります。

*それぞれm,cに対して

 

 

NDE, NIEcross-world counterfactualが成り立つことが前提

以上のassumptionをまとめるとこうなります:

 

i) ~ iii)は、A-Y, M-Y, A-Mの間にunmeasured confounderがないということ

iv)はMとYの間のconfounderはAを原因としないこと

で、

CDEはi), ii)のみ

NDEとNIEはi)=iv)

を必要とする

 

ポイントはiv)です。

これはDAGで書くと非常にシンプルなのですが、実は少し事を単純化しています。

実際に得たいindependenceは

Y(a=1,m) II M(a=0) | C

であり、

実はiv)のassumptionからこのindependenceに至るためにcross-world counterfactualが成り立つことを前提としています

*cross-worldというのは、Y(a=1,m)は「全員のAを1としたときのcounterfactual」であり、M(a=0)は「全員のAを0としたときのcounterfactual」、と2つの異なるcounterfactualを想定していることを意味します。

 

これがなぜ問題かというと、2つの異なるcounterfactualを同時に観測することは不可能だからです。

これを成り立つと仮定して話を進めて良いか、理論疫学研究者内でも議論があります。

大きくは、現代の理論疫学の父であるJudea Pearl(UCLA)とJames Robins(ハーバード)の間で考え方が違うのです。

 

この2人の考え方の違いを理解するのは少し難しいですが、基本的にはCross-world counterfactualについて

・Robinsは「成り立つと仮定してはいけない」

・Pearlは「成り立つと仮定して良い」

と考えています。

当然RobinsはNDEやNIEをそもそも計算することに反対なわけです。

これは追って、少し深掘りして解説していきます。

 

以上、causal mediation analysisassumptionについてでした。

ではまた。

-疫学・臨床研究

Copyright© Riklog , 2021 All Rights Reserved Powered by AFFINGER5.