疫学の因果推論、誰のコンセプトが正しい?【ハーバードで炎上】

ある因子と病気との因果関係を調べることが疫学の最もコアな部分で、その方法は因果推論と言われます。

因果推論は近年目覚ましい発達を遂げ、今やかなり数学的です。

しかしこの発展につき、実は熾烈な論争があります。

この記事を読むことで、疫学·因果推論についてより深く洞察できるようになります。

 

 

疫学の因果推論、誰のコンセプトが正しい?【ハーバードで炎上】

疫学の因果推論についてハーバード内で炎上している件

このブログでも度々紹介している「因果推論」ですが、非常に数学的です。

・DAGという「因果関係の枠組み」をベースとして、

・Counterfactualを考えてそれを数学的に表現し、

・Exchangeabilityやconsistencyという「数学的条件」を駆使して因果効果を算出します。

 

これの生みの親が、ハーバード大学院のJames Robinsです。

彼は数学科卒、MD取得後、そのキャリアを疫学方法論に捧げた方です。

DAGやその応用法などを開発してきた、疫学方法論界隈で(Pearlと並ぶ)最も有名な存命の人物でしょう。

*天才的で人柄もよいのですが、いかんせん授業するのが下手です。Miguel Harnanという教え子(今や有名な教授)が、わかりやすく彼の考えを発信していった経緯があります。

 

一方、Nancy Kriegerという社会行動学の権威(ハーバードの教授)がいます。

彼女は疫学の「theory」をまとめあげ、彼女自身が「ecosocial theory」というものを提唱したというすごい人です。

特に「racial disparity」に対し強いpassionを持って研究·活動しています。

疫学の歴史に詳しく、因果推論が内包する様々な難しさを熟知しており、DAGをベースとした考え方にかなり否定的です。

 

最後にTyler VanderWeeleというハーバードの教授。

彼は社会行動学の教授ですが、数学的なバックグラウンドがあり、Counterfactualの理論を社会行動学に応用してきた第一人者です。

例えば、「causal mediation analysis」という概念を作り上げた方です。

*Causal mediation analysisは実際の研究でかなり応用されている手法で、例えばハーバード大学院のpopulation health scienceのPhD課程では、全員必修で学びます。

しかし、NancyやJamesから批判されています。

 

なぜ天才である彼らの中で論争が生じるのか??

非常に面白いポイントです。

では中身に入っていきましょう!

 

 

Nancyの論文から始まった

ご存知の通り、現在の疫学方法論は「DAG」というグラフに基づきます。

DAGは因果関係の向きを「→」で示す、一見かなり単純なグラフです。

このグラフを(統計でなく)知識ベースで書き、そこから交絡因子や選択バイアスを同定し、解析に活かすのです。

勉強すればわかるのですが、このDAGは確率分布を示す、完全に数学的なグラフです。

Nancyはこれを痛烈に批判しました(International Journal of Epidemiology, 2016, 1787–1808 )。

論点は以下の通りです:

・疫学の発展の歴史を専門とするNancyにとって、現在のDAGベースのアプローチは手法の一つに過ぎないのに、それが唯一無二となってしまっていること

・DAGさえ書ければ因果関係が言及できる、という主張に構造的な問題があること

 

このNancyの主張を理解するには、優生学(Eugenics)についての歴史を簡単に知る必要があります。

というのも、そこにNancyの強いpassionがあるからです。

 

 

優生学を知っているか

優生学とはご存知の通り、「遺伝子に優劣がある」ことを主張する学問で、結果黒人差別や精神疾患患者の強制不妊手術、ナチスのユダヤ人迫害に至る諸悪の根源となった学問です。

しかしこれは、Mad scientists達が「自分の(優生である)遺伝子を広めるため」に行っていたやばい学問、と捉えるのは誤っています

おそらくその時代、それが人類のためになると考え、優秀な科学者が「科学的に正しい」と考え、行ってきた研究なのです。

 

例えばその時代、明らかに黒人の方が白人に比べて心筋梗塞や感染症になるリスクが高かった。

これは色々な因子で「調整」してもその結果であり、おそらく「黒人ということが原因」でいろいろな疾患リスクが高まる、というふうに考えられた。

*疫学とはある因子と病気との因果関係を言及するための学問でした

 

すると、黒人という因子に介入すれば、人類の病気の負荷は小さくなる。国の医療費も減る

よって、黒人を少なくし白人を増やせば良い

という論理的な思考に基づいていたのです。

 

しかしその後「社会的要因」という因子が提唱され、それこそが疾患リスクの原因であると知られるようになりました。

つまり「黒人」が疾患の原因であったわけではなく、黒人の生活環境や社会環境がかなり悪く、それを介した交絡を見ていただけだったのです。

こういう科学的な見落としがあったせいで、迫害という最悪の結果につながってしまった。

 

しかし、もし昔からDAGがあったとしても、この大きな流れは変わらなかったでしょう。

物事の因果関係をいうというのは、とてもとても難しい事なのです。

そもそも正確なDAGは描けない。

当時の科学者が誤った主張をしていたのは、「社会的要因」ということをそもそも考えていなかったから

そこで重要になるのは、統計でなく、哲学や科学の歴史。

DAGは大事かもしれないが、本質的ではない。

*こういう気付きからNancyは「ecosocial theory」という一分野を築いたのでした

 

 

生物学的な「人種」は疾病の原因か

Nancyは、JamesのみならずTylerも批判しています。

Tylerに対しては、「raceのcoefficientの解釈=もしraceというものに介入したとしたらの結果Am J Epidemiol 2014;25:473-54 )」という彼の主張に対して、Nancyは強い嫌悪感を持ったのだと思います。

「明らかに生物学的なraceが原因でないのに、あたかも原因であるかのような誤った主張だ」とバッサリ切っています。

 

例えば「racial disparity」の論文は、暴露因子をraceとして、様々な交絡因子(経済状況など)で調整したモデルで、「raceのcoefficient」を「もし黒人でなく白人であった場合のアウトカムへの影響」として解釈しえます(黒人がrace=0、白人がrace=1とラベルされていた場合)。

だから黒人がそのアウトカムに対して不利だ(だから政策を見直せ)、というのが主張だったりします。

しかしNancyは「生物学的な人種」自体が本当に原因だと思ってません。

*実際そうだという意見が大半です

 

上に述べたように、そのような研究から優生学による悲劇が生じた歴史もあります。

つまりraceのcoefficientを「因果関係として解釈する」のには非常に注意が必要だし、そもそもその統計モデルでraceを暴露因子とした因果関係は言及できないと考えています。

Nancyからしてみれば、Tylerに対し「なに優生学を支持するような意見を主張しているの?」という感じだったようだと思います。

 

 

*********

以上のように、NancyはJamesとTylerを痛烈に批判しました。

引き続き、Jamesの反論を見ていきましょう。

 

 

DAG生みの親であるJamesの主張

DAG生みの親であるJamesの主張

JamesのDAGに対する立ち位置は、NancyやTylerとは異なります。

Jamesは「well-defined intervention」しかexposureの資格はない、と考えています。

どういう事かというと、介入可能な因子しかexposureになりえないし、因果関係も言及できない、ということです。

 

そもそも「因果効果」というのは、「それに介入したときの結果」ということなので、介入できないexposureがそもそも意味を持たないというのはreasonableです。

その一番の例が「人種」です。

人種はどうやっても介入できないので、そもそもscientific questionとしてDAGの枠組みで取り組む対象とならない、というのがJamesの主張です。

Nancyの批判に対して、論文で答えています(International Journal of Epidemiology, 2016, 1830–1835 )。

 

実際、Jamesの主張するwell-defined exposureの定義は厳密です。

例えば「BMI>30 vs ≤30」というのは、暴露因子になりえません

だってBMIというのは今の状態であり、介入できないから。

暴露因子になりうるのは、例えば「この1年でBMI 2以上の減少あり vs なし」というもの。

Jamesは因果推論に関する全ての研究に対して、RCTを見越しているのです。

結局RCTをやらないと本当の事はわからず、RCTを行えない観察研究で因果関係は主張できない、というのが彼のスタンスです。

 

そして、数学的にはDAGをベースとしたアプローチは何も間違っていません

つまりNancyの「DAGは一つの疫学的手法に過ぎない」という主張に、かなり批判的です。

Jamesからしてみれば、そもそもDAGの数学的な背景を知らずしてDAGを議論すること自体が意味不明と思っていそうです。

実際Nancyの論文では、数学的な部分が一部はぐらかしているように受け取られうる箇所も多数あり、数学者のJamesとしては、「これは数学的に正しいけど?」といった感じでしょう。

 

加えてJamesは、実際のPolicyへの反映は別次元だ、と主張します。

Nancyの主張は、疫学研究がpolicyに反映される事を基本とするもの(優生学であったように)ですが、Jamesはそこに関してやや懐疑的です。

 

 

Tylerに対しては「本なんて出しちゃって」というスタンスでの批判

そんなことを授業で言っていました笑

Tylerが提唱しているcausal mediation analysisについては、因果推論本家のJamesは認めていません!!

 

causal mediation analysisは、exposureとmediatorの2つのcounterfactualを考える手法です。

Jamesが批判しているのは、causal mediation analysisの因果効果を確かめるためのRCTをデザインすることはできないからです。

より数学的には、cross-world independencyが成り立つとは仮定しない、というのがJamesの理論です。

 

theoryの生みの親が反対している、その教え子が打ち立てた理論がこんなに流行ってしまうとは、面白い事象ですね。

*Causal mediation analysisは、界隈ではかなり流行っているアプローチです

*Jamesの他にPearlという巨匠(現在UCLAの教授)がおり、彼のスタンスはJamesと少し違い、よりTylerの主張と親和性があります。

→具体的な考え方の違いはこの記事の第5章で解説しています。

 

 

Tylerの主張

お二方から散々批判されているTylerですが、彼も当然科学的な主張があり、論文で反論しています(International Journal of Epidemiology, 2016, 1809–1816 )。

彼の立ち位置は、大まかに言って、「DAGなんかで因果関係が言えるはずもない」というNancyと、「DAGは間違っておらずその運用のされ方が間違っている」というJamesの間にあります。

 

彼の主張は以下のとおりです:

・DAGと統計モデルで算出されるのは「因果効果」であり、実際の「因果関係」とは異なる

・DAGより良い「因果効果を計算するモデル」はない。

*因果効果は、基本的には介入可能な暴露因子(RCTできるもの)に対し計算可能である

 →人種など介入不可能な因子に関して、因果効果がどういう意味合いを持つかははっきりしない

 →しかし、そのような検証を行うことは科学的に意味がある

・疫学研究で計算される因果効果は政策に反映されるべきだが、実際の政策はその他たくさんの事を考える必要がある

 

 

Raceのcoefficient問題

Raceのcoefficientを因果効果として解釈する事へのNancyの批判については、Tylerは強く反論しています。

Tylerは、その因果効果がどういう意味を持つかということについてはとても難しい問題だ、というスタンスです。

例えばTylerは、「もし黒人でなく白人だったら」という介入不可能な意味でなく、「どのくらい人種間の不公平性をなくすことができるか、という度合い」というように解釈していることもあります。

 

Nancyは「明らかに人種が原因でないのに、原因であると結論している(誤った)例」としてTylerの文献を載せていますInternational Journal of Epidemiology, 2016, 1787–1808 )。

これについては:

「そんな主張はしてないし、生物学的な人種自体が原因とも思っていない。彼らは論文をしっかり読まずにcherry-pickしている(=都合の良い部分だけ切り取って使っている)」

と強く反論しています。

 

 

あなたはどう思いますか?

Nancy, James, Tylerというそれぞれの分野の牽引者達が、ハーバード内で激しく論争している、という事実を紹介しました。

紹介した論文は2016年のものですが、2019年にハーバード内でセミナーがあった際も、なんだか議論が噛み合ってませんでした。

 

全員超一流の科学者ですが、

・Nancyは「因果関係は簡単に導けないし、その結果大問題に繋がりうる」

・Jamesは「数学的に正しいことは正しい。DAGは介入可能なexposureにしか使えない」

・Tylerは「注意した上で、社会行動学的な介入不可能なexposureにDAGを応用することは意味がある」

という異なった、それぞれ正しい哲学があることが、論争の原因だと思います。

 

あなたは誰派ですか?

ではまた。

-疫学・臨床研究

Copyright© Riklog , 2021 All Rights Reserved Powered by AFFINGER5.