ちょっとニッチかもですが、case-only estimatorについて解説します。
これは簡単にinteractionが計算できる代物。
主にgene-environment interactionで使われます。
知らないと??なので、解説です。
Case-only estimatorの解説
まず、case-only estimatorとは何か。
今、アウトカムYに対する、ある遺伝子変異Gと環境因子Eとのinteractionを知りたいとします。
普通にやるなら、例えばこんなlogistic regressionです:
logit Pr[Y=1|G,E,交絡因子] = β0 + β1*G + β2*E + β3*G*E + β*交絡因子
これでexp(β3)がmultiplicative scaleのgene-environment interactionを意味するのでした。
*interactionについてはこちら
***
さて、Case(outcomeありの人)に限って、こんなregressionをしてみましょう。
logit Pr[G=1|E,交絡因子,Y=1] = α0 + α1*E + α*交絡因子
Caseありの人の中で、Eがどの程度Gを説明するのか、というregressionです。
*case-onlyなので「|Y=1」なわけです。
さて、なんとこのα1が、上のβ3と一致する!!
という話なのです。
(信頼区間も一致します)
つまりcontrolのデータがなくとも、gene-environment interactionがcaseの情報だけで算出できる、という驚きの手法。
これがcase-only estimator!!!!!!!
なんで?
厳密な数式の証明は割愛として、
簡単に解説できます。
Multiplicative scaleのgene-environment interactionとは、
Caseにおけるgene vs. environmentのリスク比 ÷ Controlにおけるgene vs. environmentのリスク比
というのが定義ですよね。
(リスク比→オッズ比でもOK)
もし分母=Controlにおけるgene vs. environmentのリスク比=1だったら?
Multiplicative EMM = Caseにおけるgene vs. environmentのリスク比
となり、まさに上の式の通りなわけでした。
そう、この「分母=1」ということが、case-only estimatorに必要な唯一のassumptionです(次)。
ざっくり言うと。
Case-only estimatorの注意点
2つほど、大事な注意点があります。
・その集団(実際はcontrol群)においてGとEが独立していること
これが唯一のassumptionです。
gene-environment interactionの場合、大抵成り立ちますね。
*なおほとんどの場合交絡因子で調整しますが、その場合その交絡因子に対するconditional independenceで十分です。
・Multiplicative scaleのみ評価できるということ
Multiplicative scaleのinteractionとは、logistic regressionの場合「OR11/(OR10*OR01)」で、
→これにrare disease assumptionを加えて、RRのinteractionとして解釈するのは常套手段でした。
Case-only estimatorでは、最終的に「RR11/(RR10*RR01)」という値とその信頼区間が得られる、ということになります。
実際、Additive scaleのinteractionこそが重要ですが、それは求められません。
そもそもlogistic regression等を使う場合、
・OR11などをRR11などに近似し、
・RERI(RR11-RR10-RR01+1)を計算
・RERI>0かどうかでadditive interactionの評価に用いる
というのが常套手段です。
しかしcase-only estimatorではRR11などそれぞれの値は分からないので、RERIを求められない、ということです。
結論
Case-only estimatorは、GとEのconditional independenceを基に、それらのmultiplicative scaleでのinteractionを計算する手段。
ではまた。