COX比例ハザードモデルって、ちょっと難しく感じる方もいるかもしれません。
ロジスティック回帰同様、統計ソフトで簡単にモデルできますが、論理背景がちょっと違います。
特に、Proportional hazardという仮定に基づいていることが、とてもとても重要です。
そして実は、その仮定はほとんどの場合成り立たないのです!!!
この記事ではCOX比例ハザードモデル、Proportional hazardの意味、Proportional hazardが成り立たない理由について、数式をほぼ使わず実線的に解説しました。
Let's go!
Contents
COX比例ハザードモデルについてわかりやすく解説(基本の「き」)
まずCOX比例ハザードモデルとはなにか一言で言うと、
「ロジスティック回帰+生存時間というパラメータ」
です。
ロジスティック回帰は0か1かのアウトカムを予測しますね。
でもそこに時間の概念はありません。
なので「死亡」がアウトカムだとしたら、全員3年間フォローアップされているものとして解析する必要があります。
→その場合、アウトカムは「3年間の死亡」となります。
*ロジスティック回帰の原理はこちら
一方COX比例ハザードモデルは、時間が経つにつれてどのような加速度で死亡が増えていくか(ハザード)を比較する方法です。
*ハザードの概念に自信が無い方は、こちらの記事を参照ください。
まずはCOXモデルのコンセプトを理解していきましょう!
COX比例ハザードモデルのコンセプト
生存解析の問題は、微分積分を避けては通れない所です。
しばらく数学に触れていないと、微分が出てきた時点でアレルギー反応を起こします。
ですので、この記事では極力数式での説明は省き、概念的な理解を目標とします。
実際それでOKです
COX比例ハザードとは、当然「ハザード」というパラメータをモデルする方法です。
「ハザード」とは「どれくらいの加速度でイベントが起きていくか」でした。
よって当然、ハザードは、時間によってその値が変わります。
✔例えば「糖尿病有無で手術後の死亡率比較した」という研究を考えます。
どちらの群も、手術直後の1ヶ月は死亡の増え方はかなり多いが、その後は徐々に少なくなっていきますね。
最初の頃のハザードは大きいが、やがて小さくなるという事です。時間とともに変わってます。
このハザードを求めようとすると、大変です。
そこでCOXさんは、ハザードを求めず、2群のハザード比だけを求めようと考えました。
上の例で言うと、糖尿病患者の手術後のハザードは求めなくて良い。
代わりに、糖尿病患者 vs. 非糖尿病患者のハザード比だけ求めたい。
こういうことです。
そこで一つ大事なことに気づきました。
「ハザードは時間によって変わっていくけど、ハザード比は時間によって変わるのかな?」
糖尿病患者が、手術後に死亡するリスクは時間によって違うけど、
糖尿病患者とそうでない患者を比較した死亡リスクの比は時間によって変わらないんじゃないか?
→この仮定がproportional hazardと呼ばれる、COX比例ハザードの根本の仮定となります。
→Proportional hazardが成り立たなければ、COX比例ハザードモデルは間違っている事になります。
*ご察しのとおり、proportional hazardはほとんどの場合成り立たないことが分かっています。
なぜ成り立たないか?これは追って説明します。
でも多くの論文がその事実には目をつぶって、COX比例ハザードモデルを使い続けています。
COX比例ハザードモデルの式
ハザードを求めず、ハザード比だけを求める
こんな事がどうやったらできるのか。
こうやるんです。
(ここだけ、ちょっとだけ、数式です)
<ハザード>=<ハザードのもと> × exp (a1*糖尿病の有無)
*<ハザードのもと>は求めません
*ハザードも、ハザードのもとも、時間に依存します
*exp()とは、自然対数の底eの()乗、ということです
→こうすると
・糖尿病患者のハザード:ハザードのもと × (eのa1乗)
・糖尿病でない患者のハザード:ハザードのもと
…eのa1*0乗(つまり0乗)は1だからです
→→よって、糖尿病の有無によるハザード比は、eのa1乗となります
(ハザードのもとが相殺される)
色んな因子を入れても同じ
多変量ロジスティック回帰のように、交絡因子で調整できます。
この場合、
<ハザード>=<ハザードのもと>× exp (b1 × 糖尿病の有無 + b2 × 交絡因子1 + b3× ….)
とexp ()内が増えていきます。
で、やりたいことは
「交絡因子が全部同じ値で、糖尿病の有無だけが異なるときに、ハザードがどう違うか」
ということなので、
*因果関係を求めるためです。相関関係との違いは:この記事で
exp() 内は
糖尿病患者:b1 + b2 + b3 +…
非糖尿病患者:0 + b2 + b3 +…
(…は同じ)
ということになります。
で、両群の比ととると、
<ハザードのもと>とexp()内のb2以降が相殺されて、
ハザード比=b1
となるわけです。
*a1がどうなるか、b1がどうなるか、というのを統計ソフトで計算するわけですね
大事なのはProportional hazard。これ一つ。
<ハザードのもと>を計算しなくてもハザード比が求まってしまいました。
つまり<ハザードのもと>は何でも良いんです。
すごいですね。
*<ハザードのもと>をbaseline hazardといったりします。
*何でも良いという意味は、時間経過に応じて、ハザードのもとがどう変わっても良い、ということです。
でも何でもよくない仮定がありましたね。
Proportional hazardです。
どの時間においても、糖尿病患者のハザード÷非糖尿病患者のハザードは一定だ
という仮定です。
そもそも上で計算したように、
ハザード比=b1
と定数で求まる(時間に応じた変数でない)ので、そりゃあそのとおりだ(ハザード比は時間によって変わらない=porportional hazardだ)、となるわけです。
********
でもこのProportional hazard、実は成り立つわけが無いんです。
ここから、これを解説していきます。
Stay tuned
Proportional hazardは成り立たない。
以降、界隈ではとても有名な論文、因果推論の第一人者Miguel Hernan先生の「The Hazards of Hazard Ratio」という論文に基づいています(Epidemiology. 2010; 21(1): 13–15.)。
復習です。
COX比例ハザードモデルの最も根本的な前提=Proportional hazard。
→ ハザード=イベントが増えるスピード、は何でも良いが、比較している両群のハザードの比は一緒、という仮定です。
Proportional hazardが成り立たないと、COXモデルは間違いです。それを前提としているから。
そしてこれが実はほぼ常に成り立たないのです。
逆に考えるとわかりやすいです。
どういう時にProportional hazardは成り立つのか?
(よく考えればわかりますよ!)
👇
👇
👇
👇
👇
👇
👇
答えは、
治療効果がすべての期間全く同じ場合です。
?
具体的に考えていきましょう。
A. 閉経後のホルモン治療は心血管病を増やすか?
界隈では超有名なWomen’s Health Initiativeというランダム化試験です。
これは結局、ハザード比1.24でホルモン治療は心血管病を増やす、と結論されたのですが、
・最初の1年はハザード比1.8
・5年後はハザード比0.70
だったのです。
明らかにハザード比、変わってますよね(=Proportional hazardが成り立っていない)。
なぜこんな事が起きるのか??
★解説!(ここがポイントです)
最初の1年でホルモン治療により心血管病となった人は、ホルモン治療の影響を受けやすい人なのです。
ホルモン治療は、そういう方の心血管病を増やしてしまった。
では5年後まで、心血管病にならず残った人は?
彼らはホルモン治療を受けても心血管病にならなかった強者。
つまり心血管病に極めてなりにくい人なのです。
5年後、治療群にはこの強者達しか残っておらず、プラセボ群は自然経過で残った人たち。
当然治療群の方がイベントが少なかった、ということなのです。
これ超重要なことなので繰り返します。
✔ホルモン治療は、心血管病になりやすい人に対し、心血管病が早めに起こってしまうよう作用した。
✔結果、ホルモン治療群で最後まで残った人達は、心血管病に極めてなりにくい人になっていた。
✔つまり、ホルモン治療群vs. プラセボ群で、最初はランダム化してフェアな比較だったのが、5年後にはフェアな比較でなくなってしまっていた。
このように「害を引き起こす介入で最後の方まで残る人は強い人になってしまう」という選択バイアスが自然に生まれてしまうのです。
Built-in selection biasと論文では言っています。
B. スタチンは心血管病を減らすか?
スタチンとプラセボをランダム化して、心血管病が減るかどうか、昔試験を行いました。
今から考えると当然スタチンは心血管病を予防します。実際ハザード比も0.6近かったのです。
でも即効性があるわけないですね。
この研究では、最初の1年間は両群に差がありませんでした。ハザード比はほぼ1。
その後、だんだん治療群と差が開いていきました。
ハザード比が変わっているので、Proportional hazardは成り立っていませんね。
どういう選択バイアスが働いているかというと、「スタチンへの感受性が時間依存的」ということです。
このように効くのに時間がかかる介入の場合も、Proportional hazardが成り立たないんです。
C. PSAによるスクリーニングは、前立腺がんを減らすか?
どう思います?
スクリーニングしたら、しないのと比べて、最初の1年は前立腺がん絶対増えますよね。
でも彼らが治療されちゃえば、その後減りますよね。
・最初の1年はハザード比は1を超え
・その後はハザード比が1を下回る
Kaplan-Meier曲線でみてみると、クロスするやつです。時々見ませんか?
こういう時は明らかにProportional hazardが成り立ちません。
*ちなみに・・・・・前立腺がんのスクリーニングは結局やらない方がよいのか??
最新のエビデンスはこの記事で解説しています。
どういう時に「治療効果がすべての期間全く同じ」か?
以上の例から考えて、
Proportional hazardが成り立つ時はどういう時だと思います?
答えは、
介入が全く効果が無い時
です
(*_*)
なぜなら、
介入が効果がある場合、
・最初から効果が現れる→A or Cのパターンで成り立たない
・効果が現れるまで時間がかかる→Bのパターンで成り立たない
からです。
だから、ほとんどの場合Proportional hazardは成り立たない
=COXモデルは誤っている
と言えるのです。
え?Proportional hazardの検定は?
よく「proportional hazardが成り立っているか」という検定が行われることがあります。
でも、これは意味ありません。
だって、論理的に成り立つわけがないんだから。統計検定する意味がない。
*交絡因子の決め方と同じです:この記事参照
*興味あれば、「Why test for proportional hazards?」(JAMA. 2020;10.1001/jama.2020.1267.)参照下さい
*******
でも一応、Proportional hazardの検定方法を紹介しておきます。
ボスからやれって言われたらやった方がいいですよ。そのためです。
主に4つ。
👇
✔Schoenfeld residualsによる検定
→これが一番一般的。p<0.05でProportional hazardが成り立っていないことを意味する
→重要なのは、p≥0.05でも「Proportional hazardが成り立っている」とは言えないこと
(こういう場合はおそらくpower不足である)
✔Kaplan-meier曲線を書いて見てみる(survivalの減り方が同じくらい)
✔log[log(Survival)] vs. log(t)をプロットしてみる
✔モデルに暴露因子*時間というinteraction termを入れて有意性を検定する
→やれば分かりますが、大抵有意になります
論文ではSchoenfeld residualの検定を行えばOKですが、p≥0.05でも本当はProportional hazardは成り立っていません。
そのうち、Proportional hazardは成り立たないということが、コンセンサスになっていくと思っています。
じゃあどうしたらよいのか??
解決策は4つほどあります。
→この記事へ続く・・・・。
まとめ
ハザードは時間に依存する変数。
ハザードを求めなくてもハザード比が求められるのがCOXモデル。
その仮定はproportional hazardというもので、これは成り立つわけがないことが知られている。
成り立つのは、介入に効果がない場合のみ。
Oh my god!
ではまた。