マッチングした症例対照研究で、マッチした要素で調整する必要がある理由

症例対照研究では、マッチングがよく行われます。

年齢とか性別とか。

意外に知られていないのは、メインの会席ではそのマッチした要素で調整しないと、バイアスのかかった結果となってしまうということ。

何故なのでしょうか?

この記事で解説していきます。

 

 

マッチングした症例対照研究で、マッチした要素で調整する必要がある理由

マッチングした症例対照研究で、マッチした要素で調整する必要がある理由

症例対照研究のマッチング、よく行われますね。

そもそも症例対照研究とは、あるアウトカム(心筋梗塞とか)を発症した人(ケース)と発症していない人(コントロール)を、一定の割合で抽出する方法です。

 

マッチングするとはどういうことかというと例えば、

・60歳男性という集団から、ケースとコントロールをそれぞれランダムに抽出する

ということです。

 

そうすれば、年齢と性別という因子はケース群とコントロール群でバランスが取れていることになる=フェアな比較になるというわけですね。

因果推論を行うには、両群の状態をフェアにすることが重要なのでした(こちら参照)。

 

普通マッチングしたら、メインの解析ではその因子で調整する必要はありません。

なぜなら既に両群のバランスが取れているから。

でも、症例対照研究では「マッチング因子で調整しなくてはいけない」のです。

知ってましたか??

なぜなんでしょう。

 

*症例対照研究(case-control study)についてはこちらで解説しています。

 

 

具体的に考えてみよう

妊婦を対象として、「運動と早産の関連性」を調べたいとしましょう。

喫煙は重要な交絡因子です。なぜなら、

・喫煙している人は運動していない

・喫煙していると早産が増える

からです。

 

さて、nested case-control studyで、喫煙の有無をマッチングしました。

つまり、

・喫煙者のペアで、片方は早産あり、片方はなし

・禁煙者のペアで、片方は早産あり、片方はなし

という抽出を行いました。

 

そうすると、この集団で、

「喫煙の有無と早産の関連性」

はなくなりますね。

そしたら交絡はないんでないの?

いいえ、実はあるんですよ、、、、、、、

 

****

喫煙している人は、運動習慣がない人が多いんでした。

すると、

コントロール群とケース群で喫煙者の割合が同じなので、

コントロール群とケース群で、運動習慣がない人の割合も似通ってしまいます。

あれ?

あれれ???

 

運動習慣→早産

の因果関係が知りたいのに、

早産だった人とそうでなかった人で、運動習慣の割合が似通っている???

これは、、、、交絡です。

マッチしたのに!!!

 

 

症例対照研究では、マッチした因子で交絡が生じる

そういうことなのです。

この交絡によるバイアスは、上記の例のように、「exposureとoutcomeの関連性がない方向(null)」に近づきます。

つまり、メインの解析ではマッチした因子で調整しないと、「本当は関連性があるのに無いと結論してしまう」方向にバイアスが生じます

だから、例では、かならず「喫煙」という因子で調整しなくてはなりません。

 

そしたらなんでマッチングなんてするの?

と疑問に思うかも知れません。

それは、交絡因子の影響をかなり強力に排除できるから、です。

普通にモデルのcovariateに交絡因子を入れるより、マッチングしてから更に交絡因子で調整するほうが強力なのです。

 

ちなみに、case-control studyで「マッチング因子を調整する方法」には、特別なものがあります。

特別というのは、普通に調整因子としてcovariateに入れるのではない方法。

conditional logistic regressionと言います。

この解説はまたいつか。

 

ではまた。

-疫学・臨床研究

Copyright© Riklog , 2020 All Rights Reserved Powered by AFFINGER5.