臨床研究にDAGを活かす-2:corridorとselection bias

お待たせしました、第2段です。

前回はDAGの矢印=因果関係という事、exposureとoutcomeの共通の原因=confounderということ、confounderを調整する=四角で囲うことで相関関係の流れをブロックすること、を学びました。

今回は「共通の結果」、corridorについて学びます。Selection biasの原因です。

 

 

臨床研究にDAGを活かす-2:corridorとは

こんな(真偽は置いておいて)シナリオを考えてみましょう。

年齢は癌発症の原因だ(高齢ほどリスクが高い)。

性別も癌発症の原因だ(男性ほどリスクが高い)。

DAGはこうなります:

 

すると、矢印で年齢と性別が繋がりますね。

では、年齢と性別に相関関係は生まれるでしょうか?

そんなわけありませんね。

 

だって、特にその他条件があるわけでないので、ランダムにリクルートした参加者の中で性別と年齢に相関関係があるはずありません。

(すぐ下に他の具体例を紹介します)

 

このように、矢印の先が2つ向いている因子(この場合は「癌」)で、疑似の相関関係は生じないのです。

これが前回言及していなかった、とっても重要なポイントです。

そういう因子をcorridorと言います。

Corridorは2つの因子の結果、ということもできます。

 

 

Corridorの性質

Corridorは、confounderとは逆の性質を持っています。

 

すなわち:

・ほっておいてもバイアスを生じない

・調整するとバイアスが生じる

ということです。

 

具体的に考えましょう。

参加者を「癌患者」に絞ってみました。

DAGはこうなります:

 

すると、そのデータには、

・高齢者が多い

・男性が多い

となるため、年齢と性別に疑似の相関関係が生じるのです!!

 

これがcorridorの性質で、corridorを調整することによって生じる疑似の相関関係によるバイアスをcorridor bias、selection biasと言ったりします。

 

*なお、分野によって「selection bias」の使われ方が全然違うので要注意です。

疫学はかなり特殊な定義です。

 

 

Selection biasを説明!

さて、あるサプリの癌への効果(因果関係)を考えていました。

今回はconfounderをなくすためRCTを組んだとします。

するとこんなDAGになるのでした。

 

Confoundersは無視できるので、以下省略します。

また、サプリ→癌の因果関係がないものと仮定してDAGが書かれていることに注意ください(DAG 第1回参照

 

さて、RCTでサプリ or プラセボが割り振られていても、その後follow-upが途切れてしまう参加者が一定数います。

これをlost follow-upと言ったりします。

これが(疫学的)selection biasの原因になることを、DAGで示していきます。

 

さて、サプリ内服により何らかの(見えない)良い影響があったとします。

その結果、サプリ内服者の方が、プラセボ内服者よりも、lost follow-upが少なかった。

*逆でもOKです。つまり、サプリ内服により副作用が一定数出たため、サプリ群の方がlost follow-upが多かったシナリオです。

 

DAGはこのようになります:

 

ポイントは、lost follow-upしていない参加者のみが解析対象となる、ということ。

そのため、lost follow-upという項目が四角で囲われている=調整されています。

 

 

さて、lost follow-upには、サプリ内服以外の、他の原因もあります。

例えば、年齢が若い人ほど、引っ越しなり様々なイベントが生じうるため、lost follow-upが多いです。

そして年齢が癌発症の原因でもあります。

つまりこんなDAGが完成します:

 

ここで、lost F-Uという因子は、サプリ内服と年齢のcorridorになっていることがわかります。

さらにLost F-Uは調整されているので、サプリ内服と年齢に疑似の相関関係が生じてしまいます!

さらにさらに、年齢は癌と相関関係があるので、サプリ内服と癌に疑似の相関関係=バイアスが生じてしまうのです!!

 

これがlost follow-upによるselection biasの原理なのでした。

なお、サプリが何の効果もなかったとしても、lost follow-upによるバイアスは生じます!

つまり「効果あり(またはその逆)」と判断してしまうリスクがあるわけです。

 

なお、実際は年齢以外にも沢山のlost follow-upの原因があります。

実際の解析では、IPW等を用いてそれらを適切に調整することが必要です(詳細こちら)。

 

 

 

まとめ

「共通の結果」をcorridorといい、これは調整しないことが重要。

調整してしまうとselection biasが生じてしまう。

これでDAGの「基本のき」は終了です。

次回はConfounderとは何か、より突き詰めて考えていきます。

ではまた。

-疫学・臨床研究

Copyright© Riklog , 2022 All Rights Reserved Powered by AFFINGER5.