症例対照研究の基本は「Density-sampling」である

症例対照研究、疫学研究者でなければ自分で行うことはほとんどないと思いますが、論文では度々見かけます。

Case-control studyという文字を見ただけで、少し身構えてしまう方、多いのではないでしょうか。

この記事では、case-control studyの基本となる考え方、特に「density-sampling」という方法について解説します。

これを理解すると、症例対照研究で何がしたいのか、はっきりわかるようになります。

 

症例対照研究の基本は「Density-sampling」である

症例対照研究の基本は「Density-sampling」である

そもそも、なんで症例対照研究って行われるのでしょう?

多くの人がこう答えます:

アウトカムが稀だから

 

じゃあ何でアウトカムが稀だと症例対照研究が良いのでしょう?

他に理由は??

 

このあたりをはっきり理解すると、症例対照研究への抵抗感がなくなります。

では行ってみましょう!

 

【重要】controlのサンプル法を知る

ほとんどのcase-control studyはコホート研究を基にしたもの=nested case-control studyなので、これを前提とします。

あるコホート研究があり、「新しいバイオマーカーXと心筋梗塞リスクの関連性」を調べたいとします。

 

✔case-controlのcaseとは何か?

→これは「心筋梗塞を発症した患者」ですね、簡単です。

✔ではcontrolとは?

→ここで「心筋梗塞を発症していない患者」と答えた方、間違いかもしれませんよ!!!!

 

Cumulative incidence sampling(古い)

「アウトカムを発症した vs 発症していない」と2分してsamplingする方法を、cumulative incidence samplingと言います。

これは40年以上前に流行っていた方法です。

 

1976年のMiettinenという疫学者の論文で代替案(density sampling)を言われてから、この方法はマイナーとなりました(Am. J. Epidemiol., 103, 226-236 (1976).)。

 

なぜだめなのか?

·cumulative incidence samplingは全員同じ期間follow-upされた、というのが前提になるからです

 →例えば2年フォローされて心筋梗塞発症した人と、1年フォローされて発症していない人、比較すべきでないですよね

 →でもコホート研究で「フォロー期間を揃える」なんて、そんなのは無理ですよね。

*感染症とか妊娠合併症のような、「短期間のフォローアップが参加者全員に行われる」疾患を対象にした場合、cumulative density samplingで良いです。

 

Density-sampling

疫学を習う人が例外なく、最初に躓くやつです。

「person-timeを対照とする」という方法ですが、これでは意味不明ですよね。

 

実際はこんな感じです:

1) 実際のコホートでは、2月からフォロー開始された方もいれば、6月からの方もいます。そしてそれぞれフォロー期間はバラバラです。まず「一斉にフォロースタートした!」となるよう、合わせます。例えば6月スタートの人を平行移動させて2月スタートというようにします。

→すると、スタート時期はみんないっしょで、フォロー終了時期は異なる、というデータが出来上がります。

2) そしてこのデータ、一定数の人がどこかで合う特価無を発症していますね。発症した人は、それ以降のデータをなしとします(フォロー終了とします)

3) そしてポイント。フォローをみんな一斉に開始し、最初にある人がアウトカムを発症します。その時にフォローしている全員から、ランダムにコントロールを選びます

→例えば1:1のcase-control studyなら、コントロールとして1人選びます。1:2なら2人です。

4) これを繰り返します。次にアウトカムが発症したら、その時点でフォローしている人からコントロールを選出します。その次もその次も···、最後にアウトカムを発症してそれに対応するコントロールを選んだら、density-samlingの出来上がり。

 

この方法のポイントは、

·将来アウトカムを発症する人もコントロールとなる可能性がある(例えば最初のケースに対するコントロールは、ほぼ全員がサンプルされる可能性ありませうね。)

·同じ人が2回以上コントロールとして選ばれる可能性がある

という2点です。

 

このようにすれば、全員フォロー期間が違っても、フェアにコントロールを選ぶことができるわけです。

 

 

Density samplingのコントロールは何を意味している?

この方法が分かったら、そのコントロールが何を意味しているのか理解することが重要となります。

実は、「person-time」を意味している、ということになります。

 

思い返してみると、因果効果を推定するに当たって、riskとrateという概念が超重要なのでした。

・riskとは、その疾患が起きる確率。

・rateとは、総person-time中のcaseの割合。

*rateについて詳細こちら

 

***

実際:

density-samplingで得られたcaseとcontrolについて、それぞれexposureを測定します(バイオマーカーXの値)。

これで2X2の表が得られます。

これから計算されるオッズ比=実際のrate ratioということになるのです!!

(オッズ比なのでロジスティック回帰ととても相性がよいですよね!)

 

そして更に、この「オッズ比=実際のrate ratio」には、稀なアウトカムである必要がありません

つまりdensity-samplingを用いる場合、アウトカムが稀であるということはcase-control studyを行う強いmotivationとはならないのです!

 

*なぜオッズ比=実際のrate ratioなのか?

これは「density pool」というコンセプトを理解すれば簡単です(詳細はAm. J. Epidemiol., 103, 226-236 (1976).

簡単には、caseが起きるたびに、controlをpopulation at riskから抽出しているので、抽出した時点でのcaseとcontrolのfollow-up期間は同じ、ということが味噌になります。

数式では「follow-up期間」が分母分子で相殺されるので、「オッズ比=実際のrate」というのはapproximationではありません。つまり「アウトカムが稀である」という条件が必要ありません。

 

*******

じゃあなぜcase-control studyを行うか?

一番現実的には、「暴露因子測定のコストを節約するため」です。

コホート研究10万人に対し新しいバイオマーカーを測定するのは億単位のコストが掛かりますよね。

それでアウトカムが1000人だったら悲しい。

こんなときcase-control studyはwell fitです。

 

なお、case-control studyを使っても、実は複数のアウトカムを評価することができるのです。

ちなみに、複数のアウトカムを評価するスキームで一番有名なのはcase-cohort研究です。

*詳細こちら

case-control studyを使ってどうやるのかは、後日解説します。

 

 

結論

今のcase-control studyの基本はdensity-samplingで、それは

· 全員のfollow-upの開始を揃えたデータを作り、

· caseが起こるごとに、person-time at riskからcontrolを抽出する。

· 出来上がったデータのオッズ比が、元データのrate ratioとなる。

ではまた。

-疫学・臨床研究

Copyright© Riklog , 2021 All Rights Reserved Powered by AFFINGER5.