COX比例ハザードモデルって、実はほぼ間違ってるのよ【真実】

みんな大好きCOX比例ハザードモデル。

実はほぼ間違っていると言えます。

それは、Proportional hazardという仮定が成り立つことはほぼ無いと言えるから。

そして、Proportional hazardが成り立つか検定することも意味がありません。

なんででしょう?

これ知らないと・・・・・COX使っちゃダメですよ!(本当)

 

COX比例ハザードモデルって、実はほぼ間違ってるのよ

COX比例ハザードモデルって、実はほぼ間違ってるのよ

この記事の前に、COX比例ハザードモデルの基本原理をこの記事でご理解ください。

そしてあらゆる論文でCOXが使われまくっていることも知っておきましょう。

その上で、彼らのCOXモデルはほぼ全部間違ってますよ、と釘を刺しているのです。

 

なんで、そんな自信もって間違っていると言えるのか?

よくProportional hazardが成り立つか検定してるのを見るけど・・・

 

この記事は、これを数式なしで説明していきます。

界隈ではとても有名な論文、因果推論の第一人者Miguel Hernan先生の「The Hazards of Hazard Ratio」という論文に基づいています(Epidemiology. 2010; 21(1): 13–15.)。

 

*最近「Why test for proportional hazards?」という論文も出ました(JAMA. 2020;10.1001/jama.2020.1267.)。

これもほぼ同様の内容ですが、読みやすいのでおすすめ。

 

 

Proportional hazardは成り立たない。

COX比例ハザードモデルの最も根本的な前提=Proportional hazardですね。

ハザード=イベントが増えるスピード、は何でも良いんですが、

比較している両群のハザードの比は一緒、という仮定です。

(ハザードについてはこの記事を参照ください)

 

Proportional hazardが成り立たないと、COXモデルは間違いです。それを前提としているから。

そしてこれが実はほぼ常に成り立たないのです。

 

逆に考えるとわかりやすいです。

どういう時にProportional hazardは成り立つのか?

(よく考えればわかりますよ!)

*

*

*

*

*

*

*

答えは、

治療効果がすべての期間全く同じ場合です。

そりゃそうか。

これがどれくらい普通でないか、具体的に考えてみましょう。

 

 

A. 閉経後のホルモン治療は心血管病を増やすか?

界隈では超有名なWomen’s Health Initiativeというランダム化試験です。

これは結局、ハザード比1.24でホルモン治療は心血管病を増やす、と結論されたのですが、

最初の1年はハザード比1.8

5年後はハザード比0.70

だったのです。

明らかにハザード比、変わってますよね(=Proportional hazardが成り立っていない)

なぜこんな事が起きるのか??

 

★解説!(ここが本記事のポイントです)

最初の1年でホルモン治療により心血管病となった人は、ホルモン治療の影響を受けやすい人なのです。

ホルモン治療は、そういう方の心血管病を増やしてしまった。

では5年後まで、心血管病にならず残った人は?

彼らはホルモン治療を受けても心血管病にならなかった強者。

つまり心血管病に極めてなりにくい人なのです。

5年後、治療群にはこの強者達しか残っておらず、プラセボ群は自然経過で残った人たち。

当然治療群の方がイベントが少なかった、ということなのです。

 

これ超重要なことなので繰り返します。

✔ホルモン治療は、心血管病になりやすい人に対し、心血管病が早めに起こってしまうよう作用した。

✔結果、ホルモン治療群で最後まで残った人達は、心血管病に極めてなりにくい人になっていた。

✔つまり、ホルモン治療群vs. プラセボ群で、最初はランダム化してフェアな比較だったのが、5年後にはフェアな比較でなくなってしまっていた。

 

このように「害を引き起こす介入で最後の方まで残る人は強い人になってしまう」という選択バイアスが自然に生まれてしまうのです。

Built-in selection biasと論文では言っています。

 

 

B. スタチンは心血管病を減らすか?

スタチンとプラセボをランダム化して、心血管病が減るかどうか、昔試験を行いました。

今から考えると当然スタチンは心血管病を予防します。実際ハザード比も0.6近かったのです。

でも即効性があるわけでないですね。

 

この研究では、最初の1年間は両群に差がありませんでした。ハザード比はほぼ1。

その後、だんだん治療群と差が開いていきました。

ハザード比が変わっているので、Proportional hazardは成り立っていませんね。

 

どういう選択バイアスが働いているかというと、「スタチンへの感受性が時間依存的」ということです。

まあちょっとかっこよく言ってみただけです。

 

このように効くのに時間がかかる介入の場合も、Proportional hazardが成り立たないんです。

 

 

C. PSAによるスクリーニングは、前立腺がんを減らすか?

どう思います?

スクリーニングしたら、しないのと比べて、最初の1年は前立腺がん絶対増えますよね。

でも彼らが治療されちゃえば、その後減りますよね。

・最初の1年はハザード比は1を超え

・その後はハザード比が1を下回る

Kaplan-Meier曲線でみてみると、クロスするやつです。時々見ませんか?

こういう時は明らかにProportional hazardが成り立ちません。

 

 

どういう時に「治療効果がすべての期間全く同じ」か?

Proportional hazardが成り立つ時はどういう時だと思います?

 

答えは、

介入が全く効果が無い時

です(笑)

 

なぜなら、

介入が効果がある場合、

・最初から効果が現れる→A or Cのパターンで成り立たない

・効果が現れるまで時間がかかる→Bのパターンで成り立たない

ということなのです。

 

だから、ほとんどの場合Proportional hazardは成り立たない

=COXモデルは誤っている

と言えるのです。

 

 

え?Proportional hazardの検定は?

こういうことは論理的に考えるべきことで、統計検定で考えることではない、ということです。

(交絡因子の決め方と同じです:この記事参照

 

一応Proportional hazardの検定方法はこんなのがあります:

✔Schoenfeld residualsによる検定

→これが一番一般的。p<0.05でProportional hazardが成り立っていないことを意味する

→重要なのは、p≥0.05でも「Proportional hazardが成り立っている」とは言えないこと

(こういう場合はおそらくpower不足である)

✔Kaplan-meier曲線を書いて見てみる(survivalの減り方が同じくらい)

✔log[log(Survival)] vs. log(t)をプロットしてみる

✔モデルに暴露因子*時間というinteraction termを入れて有意性を検定する

→やれば分かりますが、大抵有意になります

 

論文ではSchoenfeld residualの検定を行えばOKですが、p≥0.05でも本当はProportional hazardは成り立っていません。

そのうち、これがコンセンサスになっていくと思っています。

 

ではどうしたらよいのか?

それは次回です。

 

 

結論

Proportional hazardはほとんどの場合成り立たない。

成り立つのは、介入に効果がない場合のみ。

ではまた。

-疫学・臨床研究

Copyright© Riklog , 2020 All Rights Reserved Powered by AFFINGER5.