E-valueって聞いたことありますか。
おそらく最も簡単かつ頻用されている、感度分析の方法です。
NEJMやLancetに載る一流の研究でも用いられています。
このE-valueの方法と解釈について、わかりやすく解説していきます。
*引用文献も載せたので、論文に簡単に応用できるようになります。
E-valueは超簡単な感度分析
そもそも
感度分析ってなんやねん
と思う方多いかもしれません。
感度分析の定義は、
「色々と条件を変えて解析してみて、それでも結論が変わらないことを確認する。もしくはどういうときに結論が変わるかを理解する。」
といった所でしょう。
例えば:
CRPと10年間の心筋梗塞リスクの関連を調べたとします。多変量解析で有意な関連性が認められました。
CRPが高いというのは潜在的な動脈硬化を反映しているから、という考察です。
しかし、CRPが高いのは風邪を引いているからかもしれません。
よって感度分析として、CRPが1以上の人を除外して解析を行う、といった感じです。
さて、このような「解析をやり直す」というものでない感度分析の方法があります。
その代表例が「E-value」です。
E-valueとは、
「今確認されている暴露因子とアウトカムの関連性が無くなるには、Unmeasured Confounder(測定されていない交絡因子)がリスク比〇〇で暴露因子とアウトカムに関連している必要がある」
という〇〇です。
どういう意味でしょうか?
E-valueを理解する!
最初にE-valueの式を紹介します。
E-value = RR + sqrt[RR * (RR-1)]
これだけ。
*RRとはリスク比、sqrtとは平方根(ルート)です。
*RR<1の時は、RRの代わりに「1/RR」を使います。
具体例で見てみましょう。
この記事で紹介した「マスクとコロナ感染リスク」について。
調整なしのリスク比は0.34 [95%CI: 0.26, 0.45]でした。
これのE-valueを求めてみましょう。
RR<1なので、1/0.34 = 2.94をかわりに使います。
E-value = 2.94 + sqrt [2.94*(2.94-1)]
=2.94 + 2.39
=5.33
この解釈は:
・今0.34のリスク比が1をまたぐ(1以上になってしまう)ためには、今調整されていない交絡因子Aがあることが必要。
・Aはマスクとリスク比5.33以上で関連し、Aは感染リスクともリスク比5.33以上で関連する必要がある。
以上です。
信頼区間のE-value
E-valueは信頼区間に対しても使います。
リスク比の信頼区間で、1に近い方が対象です。
例えば上記のリスク比:0.34 [95%CI: 0.26, 0.45]では、1に近い0.45が対象となります。
1未満なので、かわりに1/0.45 = 2.22を使います。
E-value = 2.22 + sqrt [2.22*(2.22-1)]
=2.22 + 1.65
=3.87
この解釈は:
・現在の95%信頼区間が1をまたぐためには、今調整されていない交絡因子Aがあることが必要。
・Aはマスクとリスク比3.87以上で関連し、Aは感染リスクともリスク比3.87以上で関連する必要がある。
こういうことです。
まとめるとこういう事になります:
・今のような(有意な)結果になっているのは、Aという強い交絡因子で調整されていないからかもしれない。
・Aは交絡因子なので、暴露因子(マスク)ともアウトカム(感染)とも関連する。
・どれくらいその関連性が強ければ、「もしAで調整したモデルを作ったら結果が逆転していまうか」?
→E-valueほどの関連性の強さだろう
E-valueはどうやって使うの?
E-valueは、全ての観察研究の感度分析として使えます。
だって全ての観察研究で、Unmeasured Confounderの存在が否定できないから。
解釈を英語で書くとこんな感じです(Ann Intern Med. 2017;167:268-274)。数値は上の例のままとしています。
“The observed risk ratio of 0.34 could be explained away by an unmeasured confounder that was associated with both the treatment and the outcome by a risk ratio of 5.33-fold each, above and beyond the measured confounders, but weaker confounding could not do so; the confidence interval could be moved to include the null by an unmeasured confounder that was associated with both the treatment and the outcome by a risk ratio of 3.87-fold each, above and beyond the measured confounders, but weaker confounding could not do so.”
このような内容をResultに書けばOK、ということです。
(当然文書盗用にならないよう、表現を変える必要があります)
*E-valueは、測定された交絡因子で調整した後で評価するのが前提です。
多変量で調整していない状態は、Unmeasured confounderの影響として評価できないからです。
これ大事。
リスク比以外では使えないの?
使えます。
というか多変量で調整したリスク比を用いるシチュエーションは少ないですよね。
<オッズ比>
・アウトカムの頻度が少なければ、リスク比同様に使えます。頻度が少ないとは、例えば15%未満とか。
・case-control研究の場合は、もともとの母集団でのアウトカムの頻度が少なければ使えます。
・アウトカムの頻度が多い場合は、式のRRにsqrt(OR)を使います(ルートを取るということ)
<ハザード比>
・アウトカムの頻度が少ない場合はそのまま使えます。
・アウトカムの頻度が多い場合は、次のような換算式を使います:
式のRR=[1 – 0.5^sqrt(HR)]÷[[1 – 0.5^sqrt(1/HR)]
*ORもHRも、1より小さい場合は1/ORまたは1/HRを使うことに注意。リスク比と同様です。
リスク差やlinear modelについては論文を参照ください。
E-valueの注意点は?
論文に書く必要ありませんが、以下のポイントに注意しましょう。
✔他の因子で調整した後、更にUnmeasured confounderの影響を評価する、というコンテクストでの使い方が妥当
→上の例では良性なしリスク比に対し使っており、それはE-valueが本来意図することではない
→なぜなら、測定可能な交絡因子では調整されるべきだから
*上の例はメタ解析なのでやや特殊な状況です
✔Unmeasured confounderが暴露因子とアウトカムに同じ様に関連する、というあまり現実的でないassumptionを置いています
→ただ、これは実際そういうunmeasured confounderがあるという風に考えているわけではなく、「それくらいの関連度の強さのunmeasured confounder」という概念的な解釈です。
✔E-valueがどれくらい低ければOK、というカットオフはない。
*E-valueに反対する学者もおります。
主張は例えばこの論文にまとめられていますが、大まかには
・E-valueを使うことで観察研究における交絡因子という重要な問題を完全にスキップできるように感じる人もいる。
→そういうわけではない。
・Unmeasured confounder以外にも、因果推論において重要な因子があり、それはE-valueの範囲としていない
→measurement error, attrition bias, selective reportingなど
確かにこのとおりです。
E-valueは簡単すぎるので、上記のようなポイントを理解した上で使いましょう。
結論
E-valueは簡単な感度分析の手法。
どれくらいunmeasured confounderの関連性が強ければ、今の結果が逆転してしまうか、という解釈。
ではまた。