メタアナリシスの解析手法はやや特殊でわかりにくいと思います。
系統的に習ったことなければ、forest plotを見るのにも抵抗感があるかと思います。
そんな方のため!
この記事では、メタアナリシスの手法の根幹であるfixed effectとrandom effect、heterogeneityについてわかりやすく解説します。ほぼ数式なし!
これがわかると、すんなりメタアナリシス論文が読めるかと思います。
*医師・研究者向けの記事です。もっと根本的な「メタアナリシスとはなにか」についてはこの記事を参照ください。
メタアナリシスの手法はやや特殊
メタアナリシスでみるForest plot。
あれがそれぞれの研究の結果をまとめているグラフだと知っていても、どうやってsummary estimateを出しているか理解している方は少ないのでないでしょうか。
そのsummary estimateに必ず付記されているI2。これも何なのでしょうか。
コホート研究の方法が分かっているが、メタアナリシスについてはあまり詳しくない方(特に臨床医)は多いと思います。
わからない点は、おそらく次のようなことかと思います。
・どうやってsummary estimateを計算するのか:
→まずデータ抽出し、重み付けの方法(weight)を決め、fixed effectかrandom effect modeを選びます。
・I2とは:これはheterogeneityについての理解が必要です。
このあたりのことを、わかりやすく説明していきます。
実際にメタ解析をする流れの通りに説明します。
データ抽出する
まずデータ抽出。
それぞれの研究のpoint estimateと95%CI、サンプル数を抽出します。
*重要なポイント:
・リスク比を計算したいならリスク比のみ、rate ratioならrate ratioのみとすることです。ハザード比ならハザード比のみ。
・adjusted hazard ratioを使いたい場合は、そのadjusted HRと、何でadjustしたかを抽出しておきます。
→理屈上はrisk ratioとhazard ratioは全然違うものですが、併せて「relative risk」としてメタ解析したものはよくみかけます。
*RRとHRの違いについてはこの記事を参照下さい
意外にも抽出するデータはこの程度なのです。めちゃ少ないですね。
コホート研究の情報がかなり簡略化されてまとめられてしまうのがメタ解析です。
これを認識しておきましょう。
Weightを決める
勿論サンプル数が大きければ、その影響度=weightは大きくなりますね。
(weightなし、というオプションもありますが、メジャーではありません)
実際にどのように計算するのでしょうか。
一番頻用されているのが、inverse variance weighting(逆分散法)でしょう。
他にもたくさんの方法がありますが、これだけ知っていればほとんど全く問題有りません。
この場合、weight=それぞれの研究のEstimateの「1/分散」です。
以上です。
*ちょっとだけ統計の話をします(飛ばしてOK)
i個の研究をまとめるとして、それぞれのpoint estimateはYi、分散がSi2だとします。
するとweight wi=1/ Si2
Summary estimateは、∑Yi*wi / ∑wi
となります。
・・・まあ知らなくても統計ソフトがやってくれます。
普通それぞれの研究の分散なんて報告されていないので、95%信頼区間やp値から逆算します(できます)。
例えば
Standard error = (upper CI – lower CI)/3.92
とか。
Fixed effectとRandom effect
これは一番重要なポイントです。
メタアナリシスに触れたことの無い方は初見だと思います。
かならずマスターしましょう。難しくないです。
最初に結論から言ってしまうと、これ。
Fixed effect:真の値はこの世で一つだけ
Random effect:真の値は母集団により異なる
ほとんどの場合、真の値は母集団によって異なりますね。なのでRandom effectを使うのが正解です。
はい、おしまい。
*********
あと一点。
Fixed effectよりもRandom effectの方が95%信頼区間が広くなります。
→つまり有意差になりにくい。
これだけ知ってればOKです。
<大補足>
この理由は、Random effect modelはどのように推定されていくかわかればわかります。
先程のweight、実はFixed effectのものなのです。
Random effectのweightは、
wi=1/ (Si2 + τ2)
と、τ2というパラメータが入ります。
これはbetween-study varianceを示します(Si2はwithin-study varianceですね)
その分、分散が大きくなるのです(もともとはSi2ですから)
*どうやってτ2を出すか、はちょっと複雑なので省きます。興味ある方はMoM estimate (method of moments estimate)でググってみて下さい。
*上記が一番メジャーな方法ですが、between-study variationがランダムであること、small studyのweightが大きくなること、τ2のestimation errorを考えていないこと等のlimitationがあります
*Random effectの求め方は他にもたくさんあります。Hartung-Knapp法やBayesian random effectsなど。ちょっと難しいです。
Heterogeneityについて理解する
無事summary estimateと信頼区間を計算できました。良かったです。
最後のポイント。
Heterogeneityです。
これは、「study間のpoint estimateに有意なvariabilityがあるか」の判断です。
勿論研究は結果が一貫していた方が信頼性が高いので、heterogeneityが高い=結果の信頼性が低い、となります。
heterogeneityが有意にあるかはQ-statisticというものを計算します。
これはk個のstudyがある場合、
Degree of freedom (df) =k-1のχ2分布
に従う事が知られており、χ2検定を行うことでp値が計算されます。
*Q-statisticは∑ wi * (iのestimate – iのweighted estimate) で、wi =1/ Si2 です。
*帰無仮説は、「k個の研究全てにおいて真実のweighted estimateが同じ」ということです。
即ち、heterogeneityがなければfixed effect estimate = random effect estimateとなります。
実際にそういう事例で計算するとτ2 =0となります。
******
そしてついにI2が登場します。
I2 = 100 * (Q – df) / Q で、df = k – 1です。
もしマイナスとなったら0にします。
解釈は👇
0-40%: 大丈夫そう
30-60%: まあまあの heterogeneityあり
50-90%: 結構な heterogeneityあり
75-100%: 重大な heterogeneityあり
まあカットオフは大体です。個人的には3-40%は結構高く感じます。
ちなみに、heterogeneityが高い時はRandom effect modelを使えばいい!というのは間違っています。
全然異なるestimate同士を合わせて評価すること自体が誤っているのです。
Qualitative differenceとも言われます。
→でもここまで来て、メタアナリシスの研究を止めることなんて、誰にもしたくないですよね。
→そういう時は、どういう観点で集団を分ければheterogeneityが少なくなるか考えることが重要です。
→つまりeffect modificationということです。
*effect modificationについてはこの記事で解説しています。
*QもI2 も完璧な指標ではないため批判もありますが、現時点ではこれを使っておけばOKです。
これさえ知ってればOK
メタアナリシスのステップ:データ抽出、weight、fixed/random effect, heterogeneityを解説しました。
これさえ分かればほとんどのメタアナリシスを理解できると思います。
forest plotに対する抵抗感がなくなったら幸いです。
ではまた。