お待たせしました、第2段です。
前回はDAGの矢印=因果関係という事、exposureとoutcomeの共通の原因=confounderということ、confounderを調整する=四角で囲うことで相関関係の流れをブロックすること、を学びました。
今回は「共通の結果」、corridorについて学びます。Selection biasの原因です。
臨床研究にDAGを活かす-2:corridorとは
こんな(真偽は置いておいて)シナリオを考えてみましょう。
年齢は癌発症の原因だ(高齢ほどリスクが高い)。
性別も癌発症の原因だ(男性ほどリスクが高い)。
DAGはこうなります:
すると、矢印で年齢と性別が繋がりますね。
では、年齢と性別に相関関係は生まれるでしょうか?
そんなわけありませんね。
だって、特にその他条件があるわけでないので、ランダムにリクルートした参加者の中で性別と年齢に相関関係があるはずありません。
(すぐ下に他の具体例を紹介します)
このように、矢印の先が2つ向いている因子(この場合は「癌」)で、疑似の相関関係は生じないのです。
これが前回言及していなかった、とっても重要なポイントです。
そういう因子をcorridorと言います。
Corridorは2つの因子の結果、ということもできます。
Corridorの性質
Corridorは、confounderとは逆の性質を持っています。
すなわち:
・ほっておいてもバイアスを生じない
・調整するとバイアスが生じる
ということです。
具体的に考えましょう。
参加者を「癌患者」に絞ってみました。
DAGはこうなります:
すると、そのデータには、
・高齢者が多い
・男性が多い
となるため、年齢と性別に疑似の相関関係が生じるのです!!
これがcorridorの性質で、corridorを調整することによって生じる疑似の相関関係によるバイアスをcorridor bias、selection biasと言ったりします。
*なお、分野によって「selection bias」の使われ方が全然違うので要注意です。
疫学はかなり特殊な定義です。
Selection biasを説明!
さて、あるサプリの癌への効果(因果関係)を考えていました。
今回はconfounderをなくすためRCTを組んだとします。
するとこんなDAGになるのでした。
Confoundersは無視できるので、以下省略します。
また、サプリ→癌の因果関係がないものと仮定してDAGが書かれていることに注意ください(DAG 第1回参照)
さて、RCTでサプリ or プラセボが割り振られていても、その後follow-upが途切れてしまう参加者が一定数います。
これをlost follow-upと言ったりします。
これが(疫学的)selection biasの原因になることを、DAGで示していきます。
さて、サプリ内服により何らかの(見えない)良い影響があったとします。
その結果、サプリ内服者の方が、プラセボ内服者よりも、lost follow-upが少なかった。
*逆でもOKです。つまり、サプリ内服により副作用が一定数出たため、サプリ群の方がlost follow-upが多かったシナリオです。
DAGはこのようになります:
ポイントは、lost follow-upしていない参加者のみが解析対象となる、ということ。
そのため、lost follow-upという項目が四角で囲われている=調整されています。
さて、lost follow-upには、サプリ内服以外の、他の原因もあります。
例えば、年齢が若い人ほど、引っ越しなり様々なイベントが生じうるため、lost follow-upが多いです。
そして年齢が癌発症の原因でもあります。
つまりこんなDAGが完成します:
ここで、lost F-Uという因子は、サプリ内服と年齢のcorridorになっていることがわかります。
さらにLost F-Uは調整されているので、サプリ内服と年齢に疑似の相関関係が生じてしまいます!
さらにさらに、年齢は癌と相関関係があるので、サプリ内服と癌に疑似の相関関係=バイアスが生じてしまうのです!!
これがlost follow-upによるselection biasの原理なのでした。
なお、サプリが何の効果もなかったとしても、lost follow-upによるバイアスは生じます!
つまり「効果あり(またはその逆)」と判断してしまうリスクがあるわけです。
なお、実際は年齢以外にも沢山のlost follow-upの原因があります。
実際の解析では、IPW等を用いてそれらを適切に調整することが必要です(詳細こちら)。
まとめ
「共通の結果」をcorridorといい、これは調整しないことが重要。
調整してしまうとselection biasが生じてしまう。
これでDAGの「基本のき」は終了です。
次回はConfounderとは何か、より突き詰めて考えていきます。
ではまた。