中間因子解析その4:Cross-world counterfactualの妥当性

Cross-world counterfactualは妥当なassumptionなのか。

前回の記事で、理論疫学者の中でも論争があると書きました。その詳細です。

少し難しい話ですが、興味ある方がいるかと思い、まとめて見ました。

これを理解できれば、理論疫学の基本の考え方について自信を持って良いと思われます。

 

 

Cross-world counterfactual

Cross-world counterfactual

今まで通り、exposureをA、mediatorをM、outcomeをYとします。それぞれ0-1の変数。

counterfactualをY(a=1)などと表します。

 

cross-world counterfactualの問題とは、

E[Y(a=1, m=M(A=0)] を考える事が妥当か

ということです。

→これはA=1とA=0という2つの異なる介入の結果であり、現実世界で観測することはできないから、問題なのでした。

 

例えばE[Y(a=1) - Y(a=0)]であれば、Aをランダムに割り振るRCTで求めることができます。

 ….当然A=1の群でE[Y(a=1)]、A=0の群でE[Y(a=0)]が観測されますね。

(ここでAがRCT可能なexposureか、ということは置いておいています。そういう問題ではありません)

 

しかしE[Y(a=1, m=M(A=0))]とはA=1かつA=0で介入された人しか観測され得ず、そんなことはどうやっても現実で観測不可能です。

一方、cross-world counterfactualを妥当と考えないと、natural direct effectなどを計算できない。

 

簡単にいうと、

妥当と考えて良い派:Judea Pearlの一派

妥当と考えて良くない派:James Robinsの一派

です。

 

****

Robins(ハーバード)は、実際の疫学研究によって因果関係を確かめることを到達地点として、因果推論の理論を構築してきています。

Natural direct effectというどんな疫学研究によっても測定することができないパラメーターは、そもそも研究対象とすることが誤りだ、という強い主張なのです。

 

ちなみに、この学派では「exposure=intervention」であり、この定義についてはかなりstrictです。

・例えば「BMI<30kg/m2」というexposure(肥満を想定しています)は、not well-defined=ダメダメ、とされてしまいます。

なぜなら「BMIを30未満/以上にする」という介入は不可能だから

→一瞬でBMIが変わる方法なんてありませんね。

 

よって、例えば観察研究においても、「1年でBMIが5減った」というexposureを考えるように指導されます

→これなら、「1年でBMIが5減る」ような介入が可能だからで、そういうRCTを行えば、そのcounterfactualの結果が観察可能だからです。

 

一方Pearlは違ったスタンスかと思われます(直接習った事はありませんが)。

実はこの2人は、異なるcausal modelを想定しているのです。

少し難しいですが、論争の歴史を振り返って学んで見ましょう。

 

*この解説はRobinsの授業に基づくので、少しバイアスがかかったものかもしれません。

 

 

NPSEMとFFRCISTG

✔︎Pearlのモデル:NPSEM

注) 最初に言っておくと、PearlもRobinsもとても頭が良いのですが、物事に名前をつけるということに関しては非常に下手です。

ご了承ください。

まずPearlが想定していたモデルは

Non-parametric structural equation model (with independent errors)

というもので、NPSEMと略します。

 

✔︎Robinsのモデル:FFRCISTG

一方Robinsはこのようなモデルを考えていました:

Finest fully randomized structural causally interpretable tree graph model

略してFFRCISTGです

(なが)

 

****

Robinsのモデルは「no causation without manipulation」というスローガンを軸にしています。

このスローガンは昔からあるもので、つまり机上の論理だけで因果関係を推論することは意味がない、という主張です。

→cross-world counterfactualを元にするnatural direct effect等は、manipulable parameterでないので、そもそもそれらを考えることが妥当でない、と考えます。

*なお、Pearlはこれに対し「causation before manipulation」という別のスローガンを掲げています。なぜこう言っているかは、この記事でわかります。

 

 

なぜ「no causation without manipulation」?

これは明快です。

実際の研究によって確かめられることがなければ、「NDE=1.4だ!」というような主張を確かめることができないから

確かめるすらできないなら、適当な事を言っても真偽は闇の中。

→それは科学とは言えない、というスタンスです。

 

なお、これに対し「そもそも、特に観察研究の因果推論のassumptionは強力すぎて現実味がなく、その点で実際の疫学研究で検証できない因果関係は星の数ほどあるのでは?」という批判があります。

→FFRCISTGでは、「そもそもhypotheticallyに疫学研究デザインを考えうるか」ということを重視しています

→以下の議論も、「どういうデザインであれば観測しうるか」がポイントになります。

 

 

E[Y(a=1, m=M(A=0))]は観測可能!?!?

「causation before manipulation」というのはある種絶対的なスローガンであり、ふつーに考えるとcross-world counterfactualは観測不可能です。

しかし、Pearlは以下のような話で、Natural direct effectは実用的に重要な概念だ、と主張したようです。

これが大変興味深いので、是非理解してみてください。

 

*****

Exposure=禁煙、mediator=高血圧、outcome=心筋梗塞、とし、exposureはランダム化されているとします。

禁煙 (A)→心筋梗塞 (Y)の因果効果が、高血圧 (M)を介するか(indirect effect)介さないか (direct effect)を知りたい。

 

ここからがポイントですが、

・タバコに含まれるニコチンが高血圧の原因となる

・タバコに含まれる他の物質は高血圧の原因とならない

と仮定できるとします。

 

→こう仮定すると、「ニコチンのみ除去されたタバコ」へ替えた場合の心筋梗塞への影響とは、元のモデルでいうnatural direct effectになりますね!!!!!!

(ニコチンがない=高血圧への効果がない、だから)

 

詳しくは、

・natural direct effect (NDE)とはE[Y(a=1, m=M(a=0)) - Y(a=0, m=M(a=0))]でしたが、

・後半のE[Y(a=0, m=M(a=0))] = E[Y(a=0)] であり、これはexposureをランダム化すれば観察可能。

・前半のE[Y(a=1, m=M(a=0))] はcross-world counterfactualで観察不可能かと思われましたが、

→「ニコチンのみ除去されたタバコに替える」という介入をランダム化すればこれが観察可能になる、ということです。

 

そして更に、

・2年後に、タバコからニコチンのみを除去する技術が開発される

と大胆に仮定します。

 

これらの仮定に基づけば、2年後にはNDEの効果が判定できるようになる、ということになります。

あれ????

 

 

FFRCISTGモデルでもNDEを計算できる!?

Robinsの提唱するFFRCISTGモデルは、g-formulaという考え方が基本にありますが、これを知らずとも、基本的な確率とcounterfactualの原理を知っていればわかります。

ここはやや数学的なので、苦手な方は読み流して大丈夫です。

上のstoryに沿って、次のようなDAGを考えます。

FFRCISTGモデルでもNDEを計算できる

exposureであるAがN(ニコチン)とO(その他)に分かれます

NだけがMの原因となります

 

ここで

「a=1, m=M(a=0)というcounterfactual」は「N=0, O=1というcounterfactual」を意味します。

(ニコチンのないタバコを吸っている、という意味です)

 

よって

E[Y(a=1, m=M(a=0))] = E[Y(n=0, o=1)] 

これを求めるには、consistencyを使えるよう

E[Y | N=0,O=1]

がわかればよいです。

 

さて、条件付き確率の定義より、

E[Y | N=0,O=1]

=E[Y | N=0,O=1, M=m] * Pr(M=m | N=0,O=1)

 

ここで

Y(n,o,m) II N | O,M

M(o) II O | N

というconditional independenceが成り立つので(D-separationでわかります)

E[Y | N=0,O=1, M=m] * Pr(M=m | N=0,O=1)

=E[Y | N=1,O=1, M=m] * Pr(M=m | N=0,O=0)

 

最後に、今のデータで

・N=1かつO=1ならA=1

・N=0かつO=0ならA=0

なので、

E[Y | N=1,O=1, M=m] * Pr(M=m | N=0,O=0)

=E[Y | A=1, M=m] * Pr(M=m | A=0)

 

ということで、

OやMの情報なくとも、今あるデータでNDEは求められる、ということになります。

*これはcausal mediation analysisでの式(つまりNPSEMモデルに基づいた式)と同じです。

 

 

何が問題か?

さて、FFRCISTGモデルでも無事NDEが求められてしまいましたが、何が問題なのでしょう?

今までの議論で、実は4つ、criticalなassumptionを行なっていたのでした。

 

i) N(ニコチン)は、必ずM(高血圧)を介してY(心筋梗塞)の原因となる

....すなわち、N→Yという直接の矢印がない、ということです

ii) OはMに影響を与えない

iii) Aは必ずNとOにのみ分解される(deterministic model)

iv) NはM、OはYにのみ影響を与える(他の因子を介さない)

これらはデータからはわからない事で、立証できないわけです。

 

Pearlの話をFFRCISTGモデルで考えると、そういう仮定をすることはでき、その仮定が合っていればNDEは推定可能、ということになります。

つまりRobinsにとっても、そういう事象が見つかるならOKですが、それはあまりに強すぎるassumptionで全く現実味がない(だからNDEを推定するのは妥当でない)、ということです。。

わかりましたでしょうか??

 

 

Controlled direct effectで良いじゃん

結局現実的にはNDEを求める研究をデザインできないので、推定しても確かめることはできず、妥当とはいえない。

それより、AとM両方に介入した結果であるCDEの方が意味がある

これがFFRCISTGモデルの結論です。

*実際は、あらゆる場合のDAGを想定し、NDEが推定可能か調べています。例えばこういう論文で解説していますが、かなり難解です

 

****

実際、NDEを出すためのassumption iv) が満たされない時、CDEを計算するためにFFRCISTGで頻用するg-formulaやMarginal structural modelを使います(time-varying exposureの対処法と同じです)

→これはやや発展的な方法なので、体系的に習った事が無いと、やや敷居の高い方法です

→つまりCDEを計算する事も、それほど単純で無いケースが(結構)ある、ということです。

 

また、NDEやNIEは机上の論理にすぎないということは広く認知されてきています

⇒それと似たような概念だけどCDEの延長である「Randomized intervantional analogue」というものが使われ始めたりしています。

(また追って解説するかもしれません)

 

 

まとめ

NDEやNIEを推定できる、と考えるのはNPSEMモデル。

FFRCISTGモデルではNDEやNIEを推定することは、結局それを得るための疫学研究をデザインできないため、妥当でないと考える。CDEを使うべき。

でもこの議論を芯から理解しようとするのは大変。

ではまた。

-疫学・臨床研究

Copyright© Riklog , 2021 All Rights Reserved Powered by AFFINGER5.