Putative placebo analysisの注意点

最近流行りのPutative placebo analysis。

簡単に言うと、「A vs. B」と「B vs. C」の結果を基に、「A vs. C」の結果を言及する、というものです。

単純に積をとるだけ。

この記事では、そんなputative placebo analysisの注意点を紹介します。

 

 

Putative placebo analysisの注意点

Putative placebo analysisの注意点

医学界で有名になったのは、今年のLancetの論文だったと思います。

心不全の新しい治療薬4つ(β遮断薬 + MRA + SGLT2阻害薬 + ARNI)、全てを用いて治療したら、一般的な2剤の治療(β遮断薬 + ACE阻害薬)と比較してどれだけ予後が良いのか、という解析。

死亡または心不全の入院に関してHR=0.38、というものすごい結果となったのでした。

*この記事で解説しています

 

しかし普通に考えてそんな訳あるか?となります。

これはかなりのassumptionを置いていることが非常に重要です。

それをはっきり認識するのが、この記事の目的です。

 

最近の論文から、putative placebo analysisを用いた他の解析を例にとって、考えていきましょう(EHJ 2020 10.1093/eurheartj/ehaa184)。

 

 

どういう研究?

以下の4つのRCTを用いた、putative placebo analysisです。

 

✔PARADIGM-HF, PARAGON-HF

→サクビトリルバルサルタン(ARNI) vs. エナラプリル(ACEi)

→それぞれHFrEF, HFpEFが対象

 

✔CHARM-Alternative, CHARM-Preserved

→カンデサルタン(ARB)vs. プラセボ

→それぞれHFrEF, HFpEFが対象

 

これらのindividual dataをとってきて、

「ARNI vs. プラセボ」=「ARNI vs. ACEi」×「ARB vs. プラセボ」

というputative placebo analysisを、

・HFrEF:PARADIGM-HFの結果×CHARM-Alternativeの結果

・HFpEF:PARAGON-HFの結果×CHARM-Preservedの結果

として行った研究です。

 

 

結果

・HFrEFについて。

PARADIGM-HFの結果:HR 0.76

CHARM-Alternativeの結果:HR 0.69

よって、putative placebo analysisではHR 0.76*0.69 = 0.52

 

・HFpEFについて。

PARAGON-HFの結果:HR 0.86

CHARM-Preservedの結果:HR 0.82

よって、putative placebo analysisではHR 0.86*0.82 = 0.71

 

でした。

 

*confidence intervalの求め方は論文に詳しく書いてありませんでした。bootstrappingを行えば難なく求まります。

 

 

Putative placebo analysisのassumption

解析簡単じゃん。

すげえ効くじゃん。

と思ったかも知れません。

 

解釈には、putative placebo analysisが前提としているassumptionを理解する必要があります。

 

1: Study間で異なる要素によるeffect modificationが無い

PARADIGM-HFは2009-2012年、CHARM-Alternativeは1999-2001年に行われたRCTです。

当然、対象患者の背景が全然違います。

例えば、β遮断薬の使用。

PARADIGM-HRでは93%。ガイドライン通り、基本的に処方されています。

一方CHARM-Alternativeでは54.5%。この頃、そこまで絶対的な適応でなかったと推察されます。

これらの結果を「かけ合わせる」ということは、どういうことか。

β遮断薬を使用してもしなくても、ARNIやACEiの薬の効果(=死亡率低減効果や心不全入院予防効果)は変わらない、と考えている、ということです。

そうかな??

普通に考えて、β遮断薬を使っていたら、それにadd-onする薬の効果はちょっと減りそうではなかろうか

そして、β遮断薬だけでもない。

このようなdirectionへのバイアスが結構あるので、かけ合わせた結果のHRは「効果をoverestimateしている」と言えます。

 

2: 用語の意味が同じ

ちょっと抽象的に書きすぎましたが、具体的には例えば、「心不全」とか「HFrEF」が意味する対象が同じ、という意味です。

心不全は色々な原因で生じる、heterogeneousな病態です。

2000年と2010年で、心不全の原因は同じと言えるか?

例えば、この記事でも解説しましたが、虚血性心疾患の救命率が高くなったおかげで、虚血性心疾患による(と思われる)心不全が増えています。

今回はEFの違いというのみで集団を分けていますが、それで十分と言えるのか、という疑問が残ります。

また、アウトカムについても同様です。

例えば「心不全入院」というアウトカムを用いていますが、入院適応は2000年と2010年で同じと言えるか

難しいところですが、重要なlimitationです。

 

3: 理想的なRCT、という推定がどちらにも当てはまる

この記事にまとめていますが、理想的なRCTには7つの条件があります。

この条件から外れると、それだけバイアスのかかった結果となりえます。

特に問題となるのは、lost follow-upとアドヒアランスの問題です。

 

4: HRを使う以上は、COX proportional hazard modelの推定が当てはまる

この記事にまとめていますが、COX modelはbuilt-in selection biasといって、その前提となるproportional hazardは成り立ちません。

特にフォロー期間が長くなると、絶対成り立たない。

このputative placebo analysisは、成り立っていない2つの指標をかけ合わせていることになります。

 

5: バイアスのかかった結果をかけ合わせると、バイアスが増幅されうる

同じ方向にバイアスのかかった結果をかけ合わせると、バイアスが増えます。

本当はHR=1だけど0.9と結論された2つの結果をかけ合わせると、0.81となってしまいます。

 

 

**************

まとめれば、putative placebo analysisをするための複数のRCTとは、

同じ集団を対象としたもので

(ほぼ不可能)

同じ時代背景のもので

(不可能:ARNI vs. プラセボが行われなかったのは、ACEiを使わないのが倫理的に許されないから。だからputative placebo analysisを行っている

全て質の高いRCTで解析のassumption violationも最小限(バイアスが最小限)

ということです。

 

やっぱりかなり厳しい。

少なくとも、質の高い(=有名な)RCTしか応用できず、しかもその解釈はかなり制限される、と知っておいてよいでしょう。

 

 

結論

Putative placebo analysisはassumptionが多い。

ではまた。

-疫学・臨床研究, 論文解説

Copyright© Riklog , 2020 All Rights Reserved Powered by AFFINGER5.