症例対照研究では、マッチングがよく行われます。
年齢とか性別とか。
意外に知られていないのは、メインの会席ではそのマッチした要素で調整しないと、バイアスのかかった結果となってしまうということ。
何故なのでしょうか?
この記事で解説していきます。
マッチングした症例対照研究で、マッチした要素で調整する必要がある理由
症例対照研究のマッチング、よく行われますね。
そもそも症例対照研究とは、あるアウトカム(心筋梗塞とか)を発症した人(ケース)と発症していない人(コントロール)を、一定の割合で抽出する方法です。
マッチングするとはどういうことかというと例えば、
・60歳男性という集団から、ケースとコントロールをそれぞれランダムに抽出する
ということです。
そうすれば、年齢と性別という因子はケース群とコントロール群でバランスが取れていることになる=フェアな比較になるというわけですね。
因果推論を行うには、両群の状態をフェアにすることが重要なのでした(こちら参照)。
普通マッチングしたら、メインの解析ではその因子で調整する必要はありません。
なぜなら既に両群のバランスが取れているから。
でも、症例対照研究では「マッチング因子で調整しなくてはいけない」のです。
知ってましたか??
なぜなんでしょう。
*症例対照研究(case-control study)についてはこちらで解説しています。
具体的に考えてみよう
妊婦を対象として、「運動と早産の関連性」を調べたいとしましょう。
喫煙は重要な交絡因子です。なぜなら、
・喫煙している人は運動していない
・喫煙していると早産が増える
からです。
さて、nested case-control studyで、喫煙の有無をマッチングしました。
つまり、
・喫煙者のペアで、片方は早産あり、片方はなし
・禁煙者のペアで、片方は早産あり、片方はなし
という抽出を行いました。
そうすると、この集団で、
「喫煙の有無と早産の関連性」
はなくなりますね。
そしたら交絡はないんでないの?
いいえ、実はあるんですよ、、、、、、、
****
喫煙している人は、運動習慣がない人が多いんでした。
すると、
コントロール群とケース群で喫煙者の割合が同じなので、
コントロール群とケース群で、運動習慣がない人の割合も似通ってしまいます。
あれ?
あれれ???
運動習慣→早産
の因果関係が知りたいのに、
早産だった人とそうでなかった人で、運動習慣の割合が似通っている???
これは、、、、交絡です。
マッチしたのに!!!
症例対照研究では、マッチした因子で交絡が生じる
そういうことなのです。
この交絡によるバイアスは、上記の例のように、「exposureとoutcomeの関連性がない方向(null)」に近づきます。
つまり、メインの解析ではマッチした因子で調整しないと、「本当は関連性があるのに無いと結論してしまう」方向にバイアスが生じます。
だから、例では、かならず「喫煙」という因子で調整しなくてはなりません。
そしたらなんでマッチングなんてするの?
と疑問に思うかも知れません。
それは、交絡因子の影響をかなり強力に排除できるから、です。
普通にモデルのcovariateに交絡因子を入れるより、マッチングしてから更に交絡因子で調整するほうが強力なのです。
ちなみに、case-control studyで「マッチング因子を調整する方法」には、特別なものがあります。
特別というのは、普通に調整因子としてcovariateに入れるのではない方法。
conditional logistic regressionと言います。
この解説はまたいつか。
ではまた。