最近流行りのPutative placebo analysis。
簡単に言うと、「A vs. B」と「B vs. C」の結果を基に、「A vs. C」の結果を言及する、というものです。
単純に積をとるだけ。
この記事では、そんなputative placebo analysisの注意点を紹介します。
Putative placebo analysisの注意点
医学界で有名になったのは、今年のLancetの論文だったと思います。
心不全の新しい治療薬4つ(β遮断薬 + MRA + SGLT2阻害薬 + ARNI)、全てを用いて治療したら、一般的な2剤の治療(β遮断薬 + ACE阻害薬)と比較してどれだけ予後が良いのか、という解析。
死亡または心不全の入院に関してHR=0.38、というものすごい結果となったのでした。
*この記事で解説しています
しかし普通に考えてそんな訳あるか?となります。
これはかなりのassumptionを置いていることが非常に重要です。
それをはっきり認識するのが、この記事の目的です。
最近の論文から、putative placebo analysisを用いた他の解析を例にとって、考えていきましょう(EHJ 2020 10.1093/eurheartj/ehaa184)。
どういう研究?
以下の4つのRCTを用いた、putative placebo analysisです。
✔PARADIGM-HF, PARAGON-HF
→サクビトリルバルサルタン(ARNI) vs. エナラプリル(ACEi)
→それぞれHFrEF, HFpEFが対象
✔CHARM-Alternative, CHARM-Preserved
→カンデサルタン(ARB)vs. プラセボ
→それぞれHFrEF, HFpEFが対象
これらのindividual dataをとってきて、
「ARNI vs. プラセボ」=「ARNI vs. ACEi」×「ARB vs. プラセボ」
というputative placebo analysisを、
・HFrEF:PARADIGM-HFの結果×CHARM-Alternativeの結果
・HFpEF:PARAGON-HFの結果×CHARM-Preservedの結果
として行った研究です。
結果
・HFrEFについて。
PARADIGM-HFの結果:HR 0.76
CHARM-Alternativeの結果:HR 0.69
よって、putative placebo analysisではHR 0.76*0.69 = 0.52
・HFpEFについて。
PARAGON-HFの結果:HR 0.86
CHARM-Preservedの結果:HR 0.82
よって、putative placebo analysisではHR 0.86*0.82 = 0.71
でした。
*confidence intervalの求め方は論文に詳しく書いてありませんでした。bootstrappingを行えば難なく求まります。
Putative placebo analysisのassumption
解析簡単じゃん。
すげえ効くじゃん。
と思ったかも知れません。
解釈には、putative placebo analysisが前提としているassumptionを理解する必要があります。
1: Study間で異なる要素によるeffect modificationが無い
PARADIGM-HFは2009-2012年、CHARM-Alternativeは1999-2001年に行われたRCTです。
当然、対象患者の背景が全然違います。
例えば、β遮断薬の使用。
PARADIGM-HRでは93%。ガイドライン通り、基本的に処方されています。
一方CHARM-Alternativeでは54.5%。この頃、そこまで絶対的な適応でなかったと推察されます。
これらの結果を「かけ合わせる」ということは、どういうことか。
β遮断薬を使用してもしなくても、ARNIやACEiの薬の効果(=死亡率低減効果や心不全入院予防効果)は変わらない、と考えている、ということです。
そうかな??
普通に考えて、β遮断薬を使っていたら、それにadd-onする薬の効果はちょっと減りそうではなかろうか。
そして、β遮断薬だけでもない。
このようなdirectionへのバイアスが結構あるので、かけ合わせた結果のHRは「効果をoverestimateしている」と言えます。
2: 用語の意味が同じ
ちょっと抽象的に書きすぎましたが、具体的には例えば、「心不全」とか「HFrEF」が意味する対象が同じ、という意味です。
心不全は色々な原因で生じる、heterogeneousな病態です。
2000年と2010年で、心不全の原因は同じと言えるか?
例えば、この記事でも解説しましたが、虚血性心疾患の救命率が高くなったおかげで、虚血性心疾患による(と思われる)心不全が増えています。
今回はEFの違いというのみで集団を分けていますが、それで十分と言えるのか、という疑問が残ります。
また、アウトカムについても同様です。
例えば「心不全入院」というアウトカムを用いていますが、入院適応は2000年と2010年で同じと言えるか。
難しいところですが、重要なlimitationです。
3: 理想的なRCT、という推定がどちらにも当てはまる
この記事にまとめていますが、理想的なRCTには7つの条件があります。
この条件から外れると、それだけバイアスのかかった結果となりえます。
特に問題となるのは、lost follow-upとアドヒアランスの問題です。
4: HRを使う以上は、COX proportional hazard modelの推定が当てはまる
この記事にまとめていますが、COX modelはbuilt-in selection biasといって、その前提となるproportional hazardは成り立ちません。
特にフォロー期間が長くなると、絶対成り立たない。
このputative placebo analysisは、成り立っていない2つの指標をかけ合わせていることになります。
5: バイアスのかかった結果をかけ合わせると、バイアスが増幅されうる
同じ方向にバイアスのかかった結果をかけ合わせると、バイアスが増えます。
本当はHR=1だけど0.9と結論された2つの結果をかけ合わせると、0.81となってしまいます。
**************
まとめれば、putative placebo analysisをするための複数のRCTとは、
・同じ集団を対象としたもので
(ほぼ不可能)
・同じ時代背景のもので
(不可能:ARNI vs. プラセボが行われなかったのは、ACEiを使わないのが倫理的に許されないから。だからputative placebo analysisを行っている)
・全て質の高いRCTで解析のassumption violationも最小限(バイアスが最小限)
ということです。
やっぱりかなり厳しい。
少なくとも、質の高い(=有名な)RCTしか応用できず、しかもその解釈はかなり制限される、と知っておいてよいでしょう。
結論
Putative placebo analysisはassumptionが多い。
ではまた。