ほとんどの症例対照研究では、年齢や性別などのマッチングが行われます。
意外に知られていないのは、メインの解析ではそのマッチした要素で調整しないと、バイアスのかかった結果となってしまうということ。
何故なのでしょうか?
そもそもマッチングの意味とは??
この記事で解説していきます。
マッチングした症例対照研究で、マッチした要素で調整する必要がある理由
*そもそも症例対照研究とは?はこちらの記事にて!
症例対照研究とは、あるアウトカム(心筋梗塞とか)を発症した人(ケース)と発症していない人(コントロール)を、一定の割合で抽出する方法でした。
実践的方法として、症例対照研究のマッチング、よく行われます。
というか、マッチングしていない症例対象研究なんて、実際ほとんどありません!
マッチングするとはどういうことかというと例えば、
・60歳男性という集団から、ケースとコントロールをそれぞれランダムに抽出する
ということです。
そうすれば、
年齢と性別という因子はケース群とコントロール群でバランスが取れていることになる=フェアな比較になる
というわけですね。
因果推論を行うには、両群の状態をフェアにすることが重要なのでした(こちら参照)。
普通マッチングしたら、メインの解析ではその因子で調整する必要はありません。
なぜなら既に両群のバランスが取れているから。
でも、症例対照研究では「マッチング因子で調整しなくてはいけない」のです。
知ってましたか??
なぜなんでしょう。
具体的に考えてみよう
妊婦を対象として、「運動と早産の関連性」を調べたいとしましょう。
喫煙は重要な交絡因子です。
なぜなら、
・喫煙している人は運動していない
・喫煙していると早産が増える
からです。
*交絡因子=調整すべきもの、とは、「暴露因子とアウトカムの共通の原因」を言うのでした(参照こちら)
さて、nested case-control studyで、喫煙の有無をマッチングしました。
つまり、
・喫煙者のペアで、片方は早産あり、片方はなし
・禁煙者のペアで、片方は早産あり、片方はなし
という抽出を行いました。
そうすると、この集団で、
「喫煙の有無と早産の関連性」
はなくなりますね。
そしたら交絡はないんでないの?
いいえ、実はあるんですよ、、、、、、、
👇
👇
👇
喫煙している人は、運動習慣がない人が多いんでした。
すると、
コントロール群とケース群で喫煙者の割合が同じなので、
コントロール群とケース群で、運動習慣がない人の割合も似通ってしまいます。
あれ?
あれれ???
運動習慣→早産
の因果関係が知りたいのに、
早産だった人とそうでなかった人で、運動習慣の割合が似通っている???
これは、、、、交絡です。
マッチしたのに!!!
症例対照研究では、マッチした因子で交絡が生じる
そういうことなのです。
この交絡によるバイアスは、上記の例のように、「exposureとoutcomeの関連性がない方向(null)」に近づきます。
つまり、メインの解析ではマッチした因子で調整しないと、「本当は関連性があるのに無いと結論してしまう」方向にバイアスが生じます。
だから、例では、必ず「喫煙」という因子で調整しなくてはなりません。
*****
そしたら、そもそもなんでマッチングなんてするの?
と疑問に思うかも知れません。
それは、交絡因子の影響をかなり強力に排除できるから、です。
普通にモデルのcovariateに交絡因子を入れるより、マッチングしてから更に交絡因子で調整するほうが強力なのです。
*ちょっと正確に言うと、マッチングによりモデル内の全ての因子とマッチング因子のinteractionが説明される、となります
なお、case-control studyで「マッチング因子を調整する方法」には、特別なものがあります。
特別というのは、普通に調整因子としてcovariateに入れるのではない方法(調整因子についてはこちらで概説しています)。
Conditional logistic regressionと言います。
この解説はまた後日。
まとめ
マッチングは交絡を強力に排除する手法として用いられる。
一般的には(コホート研究では)マッチングすれば交絡はなくなる。
しかし論理的に考えると、症例対照研究ではマッチングした因子で調整しないと、バイアスが生じてしまう。
Conditional logistic regressionを使う。
ではまた。