因果推論のスタンダードであるCounterfactualの手法(DAG)について、ハーバード内で強烈な議論がおきています。
具体的には、DAGの生みの親であるJames、人種や疫学の歴史の専門家であるNancy、DAGのアプローチを社会行動学に応用するTylerの三つ巴の様相です。
前回の記事ではNancyの立ち位置を解説しました。本記事ではJamesとTylerの主張を見ていきます。
DAG生みの親であるJamesの主張
JamesのDAGに対する立ち位置は、NancyやTylerとは異なります。
Jamesは「well-defined intervention」しかexposureの資格はない、と考えています。
どういう事かというと、介入可能な因子しかexposureになりえないし、因果関係も言及できない、ということです。
そもそも「因果効果」というのは、「それに介入したときの結果」ということなので、介入できないexposureがそもそも意味を持たないというのはreasonableです。
その一番の例が「人種」です。
人種はどうやっても介入できないので、そもそもscientific questionとしてDAGの枠組みで取り組む対象とならない、というのがJamesの主張です。
Nancyの批判に対して、論文で答えています(International Journal of Epidemiology, 2016, 1830–1835 )。
実際、Jamesの主張するwell-defined exposureの定義は厳密です。
例えば「BMI>30 vs ≤30」というのは、暴露因子になりえません。
だってBMIというのは今の状態であり、介入できないから。
暴露因子になりうるのは、例えば「この1年でBMI 2以上の減少あり vs なし」というもの。
Jamesは因果推論に関する全ての研究に対して、RCTを見越しているのです。
結局RCTをやらないと本当の事はわからず、RCTを行えない観察研究で因果関係は主張できない、というのが彼のスタンスです。
そして、数学的にはDAGをベースとしたアプローチは何も間違っていません。
つまりNancyの「DAGは一つの疫学的手法に過ぎない」という主張に、かなり批判的です。
Jamesからしてみれば、そもそもDAGの数学的な背景を知らずしてDAGを議論すること自体が意味不明と思っていそうです。
実際Nancyの論文では、数学的な部分が一部はぐらかしているように受け取られうる箇所も多数あり、数学者のJamesとしては、「これは数学的に正しいけど?」といった感じでしょう。
加えてJamesは、実際のPolicyへの反映は別次元だ、と主張します。
Nancyの主張は、疫学研究がpolicyに反映される事を基本とするもの(優生学であったように)ですが、Jamesはそこに関してやや懐疑的です。
Tylerに対しては「本なんて出しちゃって」というスタンスでの批判
そんなことを授業で言っていました笑
Tylerが提唱しているcausal mediation analysisについては、因果推論本家のJamesは認めていません!!
causal mediation analysisは、exposureとmediatorの2つのcounterfactualを考える手法です。
Jamesが批判しているのは、causal mediation analysisの因果効果を確かめるためのRCTをデザインすることはできないからです。
より数学的には、cross-world independencyが成り立つとは仮定しない、というのがJamesの理論です。
theoryの生みの親が反対している、その教え子が打ち立てた理論がこんなに流行ってしまうとは、面白い事象ですね。
*Causal mediation analysisは、界隈ではかなり流行っているアプローチです
*Jamesの他にPearlという巨匠(現在UCLAの教授)がおり、彼のスタンスはJamesと少し違い、よりTylerの主張と親和性があります。実際PearlがTylerの理論をどう思っているかは知りません。
Tylerの主張
お二方から散々批判されているTylerですが、彼も当然科学的な主張があり、論文で反論しています(International Journal of Epidemiology, 2016, 1809–1816 )。
彼の立ち位置は、大まかに言って、「DAGなんかで因果関係が言えるはずもない」というNancyと、「DAGは間違っておらずその運用のされ方が間違っている」というJamesの間にあります。
彼の主張は以下のとおりです:
・DAGと統計モデルで算出されるのは「因果効果」であり、実際の「因果関係」とは異なる。
・DAGより良い「因果効果を計算するモデル」はない。
*因果効果は、基本的には介入可能な暴露因子(RCTできるもの)に対し計算可能である
→人種など介入不可能な因子に関して、因果効果がどういう意味合いを持つかははっきりしない
→しかし、そのような検証を行うことは科学的に意味がある
・疫学研究で計算される因果効果は政策に反映されるべきだが、実際の政策はその他たくさんの事を考える必要がある
Raceのcoefficient問題
Raceのcoefficientを因果効果として解釈する事へのNancyの批判については、Tylerは強く反論しています。
Tylerは、その因果効果がどういう意味を持つかということについてはとても難しい問題だ、というスタンスです。
例えばTylerは、「もし黒人でなく白人だったら」という介入不可能な意味でなく、「どのくらい人種間の不公平性をなくすことができるか、という度合い」というように解釈していることもあります。
Nancyは「明らかに人種が原因でないのに、原因であると結論している(誤った)例」としてTylerの文献を載せています(International Journal of Epidemiology, 2016, 1787–1808 )。
これについては:
「そんな主張はしてないし、生物学的な人種自体が原因とも思っていない。彼らは論文をしっかり読まずにcherry-pickしている(=都合の良い部分だけ切り取って使っている)」
と強く反論しています。
あなたはどう思いますか?
Nancy, James, Tylerというそれぞれの分野の牽引者達が、ハーバード内で激しく論争している、という事実を紹介しました。
紹介した論文は2016年のものですが、2019年にハーバード内でセミナーがあった際も、なんだか議論が噛み合ってませんでした。
全員超一流の科学者ですが、
・Nancyは「因果関係は簡単に導けないし、その結果大問題に繋がりうる」
・Jamesは「数学的に正しいことは正しい。DAGは介入可能なexposureにしか使えない」
・Tylerは「注意した上で、社会行動学的な介入不可能なexposureにDAGを応用することは意味がある」
という異なった、それぞれ正しい哲学があることが、論争の原因だと思います。
あなたは誰派ですか?
ではまた。