Interactionは「AのYに対する効果はCによって異なるか」を示す、非常に大事な指標です。
しかしinteractionを理解しようとすると、統計的に難しい記事が多く、挫折しがちです。
この記事ではinteractionをより広く理解してもらうため、重要なポイントをわかりやすく徹底解説します。
Contents
Interactionについて知る
AのYへの影響は、Cによって異なるか
これを推定するのがinteractionですが、具体的に考えると非常に大事な意味を持ちます。
例えば:
・ある薬の癌への効果は、ある遺伝子を持っている人と持っていない人で異なるか
・運動の健康増進効果は、年齢にかかわらないか
・喫煙とアスベスト暴露、どちらもあると肺がんリスクはより高くなるか
このように、いわゆる「個別化医療(precision medicine)」発展のエビデンスとなるのがinteractionです。
この記事では、interactionについて徹底解説していきます。
*Interaction termなど、より基本的な事項についてはこの記事を参照ください。
Interactionの種類
以下
A⇒Yへの効果がCによって変わるか
を考えていきます。
さて、interactionにはざっくり2種類あります。
✔︎Effect modification
✔︎Causal interaction
これらは、Cに介入するかどうか、という概念の違いです。
Effect modificationとは、Cに介入しない場合
Causal interactionとは、Cに介入する場合
を言います。
具体的には、
・ある薬(A)の癌(Y)への効果は、ある遺伝子(C)を持っている人と持っていない人で異なるか
→Cには介入しないのでEffect modificationです。
・喫煙(A)とアスベスト(C)暴露、どちらもあると肺がんリスク(Y)はより高くなるか
→Cも介入しうるのでCausal interactionです。
これらは単純に用語の定義の違い、という認識でほぼ大丈夫です。
*詳細には、causal interactionの方はCのcounterfactualを想定することになりますが、数式的には結局Effect modificationとほぼ同等となります
Interactionのscale
これがみそです。
interactionにはAdditive scaleとMultiplicative scaleがあり、これらは別物です!!!
これは中学生でもわかる超基本的な算数なのですが、多くの人に見過ごされている問題です。
****
こんな研究結果を想定してみましょう(交絡などバイアスが無いとします):
・10年間の肺がん発症リスク(Y)をみました
・禁煙者(C)で、アスベスト暴露(A)なし:4%、アスベスト暴露あり:8%
・喫煙者(C)で、アスベスト暴露(A)なし:8%、アスベスト暴露あり:16%
✔︎Additive scaleとは、Risk difference (RD)でのinteractionです。
禁煙者においてRD = 0.08 - 0.04 = 0.04
喫煙者においてRD = 0.16 - 0.08 = 0.08
→この2つは「喫煙のステータス」によって違いますね?
→additive scaleでのinteractionあり、です。
✔︎Multiplicative scaleとは、Risk ratio (RR)でのinteractionです。
禁煙者においてRD = 0.08 / 0.04 = 2
喫煙者においてRD = 0.16 / 0.08 = 2
→この2つは「喫煙のステータス」によって同じですね?
→additive scaleでのinteractionなし、です。
つまり、scaleによって、interactionがあったり無かったりするのです!!!
自分がみているのが何のscaleなのか、まず把握してください。
Additive scaleのinteractionが知りたい
疫学研究でより重要なのは、additive scaleのinteractionです。
これは実はinteractionでなくてもそうで、そもそも知りたいのはRisk ratioよりrisk differenceであることが多いです。
だってRR = 4、つまり「4倍のリスク増加」でも、
・4% vs. 16%かもしれないし、
・0.04% vs. 0.16%かもしれませんね。
RDなら12%とか0.12%とか、よりメッセージ性がでてきます。
しかしほとんどの研究では、multiplicative scaleのinteractionしか示されていません。
なぜか?
だいたいlogistic regression(→オッズ比)かCOX proportional model(→ハザード比)が使われるから、です。
後述する方法で、additive scaleのinteraction(に似たもの)も提示することが重要となります。
Odds ratioでのmultiplicative scale
ロジスティック回帰では、オッズ比(OR)が求めたい効果の指標となります。
ロジスティック回帰にinteraction termを入れたら?
これは「ratio」のinteractionなので、multiplicative scale、ということになります。
しかし当然、risk ratioのmultiplicative scaleとは別物ですね。
上の例で考えても:
・禁煙者においてOR = (0.08/0.92) / (0.04/0.96) = 2.09
・喫煙者においてOR = (0.16/0.84) / (0.08/0.92) = 2.19
→微妙に異なり、「interactionあり」となってしまいます(risk ratioのscaleでは「なし」なのに)
このORというmultiplicative scaleのinteractionですが、non-collapsibilityという性質のため、やや扱いが難しいです。
→例えば具体的には、Risk ratioがわかればRisk differenceは計算できますが、Odds ratioがわかってもRisk differenceはわかりません。
よって現実的には:
outcomeがrareであるという推定の下、ORをRRに近似して考える
というのが一般的な対処法となります。
*non-collapsibilityを簡単に説明すると:
・男のRR1やOR1、女のRR2やOR2があって、全体のRRやORを求めたい時に、
・それぞれの人数でweightを作る
・全体のRR = RR1*weight1 + RR2*weight2 とはなるが
・全体のOR = OR1*weight1 + OR2*weight2 とはならない
→ということで、RRはcollapsibleだけどORはcollapsibleでない
Multiplicative scaleからadditive scaleのinteractionを推定する
仰々しいお題ですが、計算自体はシンプルです。
この例に戻ります:
・禁煙者(C)で、アスベスト暴露(A)なし:R00%、アスベスト暴露あり:R01%
・喫煙者(C)で、アスベスト暴露(A)なし:R10%、アスベスト暴露あり:R11%
*それぞれのリスクをR●◉とし、●はA、◉はCのステータスを表します。
これがわかればadditive scaleのinteractionを計算できますね:
(R11 - R10) - (R01 - R00)
これをR00で割ると、それぞれA=0/C=0を対象とした時のリスク比で表されます:
RR11 - RR10 - RR01 + 1
→リスク比 = multiplicative scaleで表されているのに、additive scale interactionのようなものを表します
→Relative Excess Risk due to Interaction (RERI)といい、additive scale interactionの代わりに示せるものです
なぜこれを使うべきなのか?
上に言ったように、Odds ratioからrisk differenceは求められないのでした。
よって、outcomeがrareであるという仮定の下、ORをRRに近似し、RERIとして
OR11 - OR10 - OR01 + 1
という結果を提示するのです!!!!
*ハザード比ではどうなの?と疑問になる方が多いと思います。
はっきりした方法は私の知る限り確立されていませんが、上と同様にHRのRERIを提示しても良いかもしれません。
詳細についてはTylerのこの論文(Epidemiology. 2011; 22(5): 713–717.)で検討されています。
まとめ
・Effect modificationとCausal interactionは、interactする因子に介入するかどうかの違い
・Interactionにはmultiplicativeとadditive scaleがあり、より重要なのはadditive scale
・Logistic regressionでORを求める場合、rare outcomeの仮定に基づき、RERIを計算しadditive scale interactionのようなものを合わせて提示すべき
以上です。
ではまた。