Proportional hazardsというCOXモデルの前提は、ほとんどの場合成り立ちません。
でもそれ以外の良い手法がないから(知らないから)、皆COXを使っているのです。
多変量解析する方法は、本当にCOXしか無いのか??
そんなことありません。
今回は、Proportional hazardが成り立たない時どうするか、かなり具体的・実践的な内容です。
Contents
Proportional hazardが成り立たない時、どうする?
この記事にて、COXモデルの基本原理、proportional hazardについて紹介しました。
そしてこの記事にて、proportional hazardが成り立つ場合はほとんどない、ということを説明しました。
つまりCOXモデルはほとんどが誤り。
でも実際は、今もほとんどの生存解析がCOXモデルを用いて行われています。
COXモデル・・・本当に使っちゃいけないのか?
他の多変量解析する方法はないのか?
こんな疑問に、具体的な解決策を提示していきます。
参照する論文は、引き続きMiguel Hernan先生の「The Hazards of Hazard Ratio」です(Epidemiology. 2010; 21(1): 13–15.)。
解決策1:COXモデルを使う
間違ってると言っておいて・・・なんですが。
✔一つのbetterな方法は、期間ごとのハザード比を提示すること。
フォロー1年では〇〇、2年では☓☓・・・のように。
するとproportional hazardが成り立たないことが(多くの場合)明らかになりますが、それでOKです。
なぜならどうせ成り立たない前提なので。
→こうすることで、フォロー期間に応じてハザードがどういう風に変わっていくかが分かります。
✔その上で、全体のハザード比は「weighted average of true hazard ratios」であることを認識して、数値通り解釈しない。
=つまりHR=0.70なら、「ハザードが0.3下がる」と解釈しない。
なぜならselection biasが必ず生じており、真の値は0.7でないから。
→解釈は、「全期間を通じてみるとハザードは下がった」となります。
まとめると、数値でなく、全体の雰囲気をハザード比が示すのはOK、ということです。
*ちなみに、lost-follow-upによってもselection biasが生じるので、IPWによる調整が必要になります。
これは後日解説します。
解決策2:Adjusted Kaplan-Meier curveで視覚化する(観察研究の場合)
結局COXモデルからのハザード比は参考に過ぎないので、Kaplan-Meier curveで視覚化するのが一番informativeです。
でも観察研究の場合は、交絡因子で調整しないと意味ない。
そんな時の、Adjusted Kaplan-meier curveです。
IPWで簡単にできます。
つまり、IPWのweightを計算して、そのweightをかけてKaplan-meier curveを書くだけです。
今の時代は必須スキルです。
*現実問題としては、K-M曲線のみで結果を提示してOKにはなりません。
reviewerの要請により、ほとんどの場合COXも提示することになります。
解決策3:Restricted mean survival time(RMST)を使う
これまだあまり広まっていませんが、そのうち常識になる気がします。
Proportional hazardが成り立たない場合の、最も簡単な生存解析法。
Circulationのこの論文がわかりやすいです(Circulation. 2019;140(17):1366‐1368.)。
RMSTとは簡単に言うと、「ある時間までの、Kaplan-meier curveの下の部分の面積(積分)」です。
これがsurvivalをtimeで積分したもの、mean survival timeとなります。
2群のこの差を比較する、というものです。
→すなわち、ある時間までの、2つのK-M curveで囲まれた部分の面積です
この面積は何を示すかというと、
この面積分の年数だけsurvival gainがある(eventが起こるまでの期間が延長する)
という意味です。
とてもわかりやすいですね。
統計検定は、この部分が0かどうか。
→0でない=棄却されれば、2つのsurvival mean timeに差がある、ということが言えます。
この手法の良いところは、proportional hazardのassumptionが必要ないこと。
注意すべき点は、フォロー期間によって(いつをsurvival curveの最終とするか)で、当然RMSTは異なってくるということです。
よって、kaplan-meier curveを提示した上で、「いついつまでのRMSTは・・」と検定するのが正解です。
観察研究の場合はどうすればよいか。
上に紹介したAdjusted Kaplan-Meier curveで同じ様に計算すれば良いんです(Stat Med. 2019;38(20):3832‐3860.)。
*まだあまり一般的でないので、医者のreviewerは理解できない可能性があります。
実際使う時はよく説明してあげるのが大事。
解決策4:もっと厳密にcausal inferenceをやる
この領域はとても深く、他にもたくさんやりようがあります。
“Selection biasがかからないように、RCTをsimulationする(RCTのデータを使って)”という方法もあります。
突き詰めると奥が深すぎて、因果推論専門の疫学者しかできないので、省きます。
(自分はまだそんなに厳密にできませんが、この領域にかなり興味があります)
まとめ
COX使うならlimitationを認識して、多数のtime pointのハザード比を提示する。
Restricted mean survival timeを使ってみる。
観察研究の場合はadjusted K-M curveを描く。
このあたりが現実的な対応法でしょうか。
個人的にはrestricted mean survival timeがもっと普及すればよいのに、と思います。
ではまた。