「95%の確率で、95%信頼区間の中に本当の値がある。」残念ですが、違います。95%信頼区間をどうやって計算するか、どう解釈するか。これは ‘疫学’ に親和性が高い話なので、疫学を体系的に学んだことが無いと知らなくても不思議ではありません。そして、知らなくても論文は書けます。
しかし、正しいコンセプトを知らないと、解釈が間違ったり、応用が効きません。独学で研究をやっていれば必ず直面する問題です。特にSPSSやJMPやEZRを使っている方は注意する必要があります。この記事では、95%信頼区間の正しい計算方法と、その解釈を説明します。確認してみてください。(簡略のため、この記事は回帰モデルにおける一つの計算法のみ言及します)
p値についてはこちら。
95%信頼区間の正しい計算方法
95%CI (confidence interval)は、平均±1.96 * SE (標準誤差)です。ただ、そのまま使って良いのはLinear regression(線形回帰)です。
Logistic regressionやCOX proportional modelでは、exp(平均±1.96 * SE)が95%CIとなります。exp(A)とは、e(自然対数の底)のA乗、ということです。
**********
例えば、Logistic regressionのoutputはこのような感じです。
Estimate | Std. Error | z value | p value | |
(Intercept) | -3.07 | 2.1 | -1.46 | 0.14 |
年齢 | 0.025 | 0.0069 | 3.58 | <0.001 |
糖尿病 | 0.52 | 0.37 | 1.42 | 0.16 |
脂質異常症 | -0.2 | 0.37 | -0.52 | 0.6 |
論文に載せるときは、これをこのようにしたいわけです。
Odds ratio | 95% CI | p | |
年齢 | 1.02 | 1.01–1.04 | <0.001 |
糖尿病 | 1.68 | 0.81–3.47 | 0.16 |
脂質異常症 | 0.82 | 0.4–1.69 | 0.6 |
この計算方法はmust know!です。
①exp (Estimate)とすると、それぞれのOdds ratioが求められます。
②95%信頼区間は、exp(Estimate±1.96*SE)で求められます。例えば、糖尿病の95%信頼区間の下限は、exp (0.52–1.96*0.37) = 0.81、ということです。
********
※連続変数のOdds Ratioの解釈も気をつける必要があります。よく勘違いしている人(臨床医)がいます。
糖尿病のOR 1.68とは、「糖尿病がある人が、ない人と比べ、1.68倍のオッズがある」という事を意味します。
年齢のOR 1.02とは、「1歳年齢が上がるごとにオッズが1.02倍となる」というのは間違いです。正しくは、「1歳下の人と比較するとオッズが1.02倍だ(0.02高い)」という事です。10歳差のORは、exp (0.025*10) = 1.28です。10歳下の人と比較すると、オッズは1.28倍です。
95%信頼区間の解釈
冒頭に書いたとおり、「95%の確率で、95%信頼区間の中に本当の値がある」とは間違った解釈です。正しくは、「同じ母集団から同じ研究を100回繰り返し行った時、95の研究でだされた95%信頼区間の間に、本当の値がある」という事です。
上の図がこれを示しています(Christensen E. J Hepatol. 2007;46(5):947‐54)。aのグラフでそれぞれの線が一つの研究で得られた結果で、真ん中の垂直の線が真の値です(これは誰にもわかりません)。例えば狭心症患者についての研究であれば、世の中にいる5000万人くらいの狭心症患者について、ある治療が有効なことを言いたいわけです。が、自分の研究の患者数は1000人くらい。自分の研究で出されたORは0.8で95%信頼区間は0.7-0.9だったとします。これが、このうちの一本の線ということです。アメリカのグループで行われた研究の95%信頼区間は0.6-0.8かもしれません。このように、研究によって信頼区間は勿論異なります。
仮に同じような研究が100回行われたとして、信頼区間が低い順に並べたのが、bのグラフです。自分の研究は上から10番目のもので、本当の値(OR: 0.85)を含んでいましたが、アメリカの研究は上から3番目のもので、本当の値は95%信頼区間外でした。OR 0.85とは、その治療を受けると、死亡するオッズが0.85倍となるということです。
が、実際に同じ研究が100回行われることはありません。なので、自分の研究で認められた95%信頼区間が、グラフbのどの線なのか、わからないのです。あなたの研究は、上から4番目の線かもしれません。その場合、100%の確率で、あなたの研究の95%信頼区間は真の値を含まないのです。
別の言葉で言うと、あなたの研究の95%信頼区間に真の値が含まれるかはどうかは、0%か100%です。仮に同じ研究が100回行われたとしたら、その95回は100%真の値を含む、ということです。
結論
logistic regressionは平均±1.96 * 標準誤差をした後にexpしたものが95%信頼区間ということ。
解釈は、「同じ母集団から同じ研究を100回繰り返し行った時、95の研究でだされた95%信頼区間の間に、本当の値がある」ということ。
これらは非常に大事なので、ここで抑えておきましょう。
ではまた。