メタアナリシスの手法を解説:weight, fixed/random effect, heterogeneity

メタアナリシスは最近認知度が上がってきている気がします。

一方、メタアナリシスの解析手法はやや特殊でわかりにくいと思います。系統的に習ったことがあるったり経験あれば簡単なのですが、そのような機会はあまり無いかもしれません。

この記事では、メタアナリシスの手法の根幹であるfixed effectとrandom effect、heterogeneityについてわかりやすく解説します。

これがわかると、すんなりメタアナリシス論文が読めるかと思います。実際執筆する方には必須の知識です。

 

 

メタアナリシスの手法はやや特殊

メタアナリシスの手法はやや特殊

メタアナリシスでみるForest plot。

あれがそれぞれの研究の結果をまとめているグラフだと知っていても、どうやってsummary estimateを出しているか理解している方は少ないのでないでしょうか。

そのsummary estimateに必ず付記されているI2。これも何なのでしょうか。

コホート研究の方法が分かっているが、メタアナリシスについてはあまり詳しくない方(特に臨床医)は多いと思います。

 

わからない点は、おそらく次のようなことかと思います。

・どうやってsummary estimateを計算するのか:

→まずデータ抽出し、重み付けの方法(weight)を決め、fixed effectかrandom effect modeを選びます。

・I2とは:これはheterogeneityについての理解が必要です。

 

このあたりのことを、わかりやすく説明していきます。

実際にメタ解析をする流れの通りに説明します。

 

 

データ抽出する

まずデータ抽出。

それぞれの研究のpoint estimateと95%CI、サンプル数を抽出します。

 

*重要なポイント

・リスク比を計算したいならリスク比のみ、rate ratioならrate ratioのみとすることです。ハザード比ならハザード比のみ。

・adjusted hazard ratioを使いたい場合は、そのadjusted HRと、何でadjustしたかを抽出しておきます。

→理屈上はrisk ratioとhazard ratioは全然違うものですが、併せてメタ解析したものはよくみかけます。

 

意外にも抽出するデータはこの程度なのです。めちゃ少ないですね。

コホート研究の情報がかなり簡略化されてまとめられてしまうのがメタ解析です。

これを認識しておきましょう。

 

 

Weightを決める

勿論サンプル数が大きければ、その影響度=weightは大きくなりますね。

(weightなし、というオプションもありますが、メジャーではありません)

 

実際にどのように計算するのでしょうか。

 

一番頻用されているのが、inverse variance weighting(逆分散法)でしょう。

他にもたくさんの方法がありますが、これだけ知っていればほとんど全く問題有りません。

 

この場合、weight=それぞれの研究のEstimateの「1/分散」です。

以上です。

 

*ちょっとだけ統計の話をします(飛ばしてOK)

i個の研究をまとめるとして、それぞれのpoint estimateはYi、分散がSi2だとします。

するとweight wi=1/ Si2

Summary estimateは、∑Yi*wi / ∑wi

となります。

・・・まあ知らなくても統計ソフトがやってくれます。

 

普通それぞれの研究の分散なんて報告されていないので、95%信頼区間やp値から逆算します(できます)。

例えば

Standard error = (upper CI – lower CI)/3.92

とか。

 

 

Fixed effectとRandom effect

これは一番重要なポイントです。

メタアナリシスに触れたことの無い方は初見だと思います。

かならずマスターしましょう。難しくないです。

 

最初に結論から言ってしまうと、

Fixed effect:真の値はこの世で一つだけ

Random effect:真の値は母集団により異なる

 

ほとんどの場合、真の値は母集団によって異なりますね。なのでRandom effectを使うのが正解です。

ではRandom effect modelはどのように推定されていくのでしょうか。

 

先程のweight、実はFixed effectのものなのです。

Random effectのweightは、

wi=1/ (Si2 + τ2)

と、τ2というパラメータが入ります。

これはbetween-study varianceを示します(Si2はwithin-study varianceですね)

その分、分散が大きくなるのです(もともとはSi2ですからね)

 

どうやってτ2を出すか、はちょっと複雑なので省きます。

興味ある方はMoM estimate (method of moments estimate)でググってみて下さい。

 

 

どうなるか?

Fixed effectよりもRandom effectの方が95%信頼区間が広くなります。

 

*上記が一番メジャーな方法ですが、between-study variationがランダムであること、small studyのweightが大きくなること、τ2のestimation errorを考えていないこと等のlimitationがあります

*Random effectの求め方は他にもたくさんあります。Hartung-Knapp法やBayesian random effectsなど。ちょっと難しいです。

 

 

Heterogeneityについて理解する

無事summary estimateと信頼区間を計算できました。良かったです。

最後のポイント。

Heterogeneityです。

 

これは、「study間のpoint estimateに有意なvariabilityがあるか」の判断です。

勿論研究は結果が一貫していた方が信頼性が高いので、heterogeneityが高い=結果の信頼性が低い、となります。

 

heterogeneityが有意にあるかはQ-statisticというものを計算します。

これはk個のstudyがある場合、

Degree of freedom (df) =k-1のχ2分布

に従う事が知られており、χ2検定を行うことでp値が計算されます。

 

*Q-statisticは∑ wi * (iのestimate – iのweighted estimate) で、wi =1/ Si2 です。

 

*帰無仮説は、「k個の研究全てにおいて真実のweighted estimateが同じ」ということです。

即ち、heterogeneityがなければfixed effect estimate = random effect estimateとなります。

実際にそういう事例で計算するとτ2 =0となります。

 

 

そしてついにI2が登場します。

I2 = 100 * (Q – df) / Q で、df = k – 1です。

もしマイナスとなったら0にします。

 

解釈は、

0-40%: 大丈夫そう

30-60%: moderate heterogeneity

50-90%: substantial heterogeneity

75-100%: considerable heterogeneity

です。

 

*heterogeneityが高い時はRandom effect modelを使えばいい!というのは間違っています。

全然異なるestimate同士を合わせて評価すること自体が誤っているのです。

Qualitative differenceとも言われます。

→でもここまで来て、メタアナリシスの研究を止めることなんて、誰にもしたくないですよね。

そういう時は、どういう観点で集団を分ければheterogeneityが少なくなるか考えることが重要です。

つまりeffect modificationということです。

 

*QもI2 も完璧な指標ではないため批判もありますが、現時点ではこれを使っておけばOKです。

 

 

ちょっと分かったでしょうか?

わかりやすく書いたつもりでしたが、いかがでしたでしょうか。

ここに書いたことは最低限ですが、これさえ分かればほとんどのメタアナリシスを理解できると思います。

逆にこれがわからずして、メタアナリシスの正しい解釈は不可能です。

 

気が向いたら、もう少し細かい内容も解説してみようかと思います。

ではまた。

-疫学・臨床研究

Copyright© Riklog , 2020 All Rights Reserved Powered by AFFINGER5.