オッズ比とリスク比。よく混同される違いで、大事です。
この違いはロジスティック回帰の原理とも関連します。
これを説明されているサイトを頻繁にみますが、この記事ではよりわかりやすく、プラクティカルに説明しました。
Contents
オッズとリスクの違いをインフルエンザで説明する
病気にかかるリスクを考えましょう。
1年で120人の内20人がインフルエンザにかかるとします。
インフルエンザにかかる確率=リスクは、20/120=1/6です。
オッズはというと、かかる人÷かからない人なので、20/100=1/5です。
リスクがわかればオッズが簡単に計算できますね。
大事なポイントは、
リスクは確率なので0~1の間。
オッズは1以上にもなりうる(最大+∞)。
ということです。
インフルエンザにかかる人の方がかからない人より多かったら、オッズは1を越えますよね。
オッズ比とリスク比の違いをインフルエンザで説明する
ワクチンを受けた人は、120人の内10人しかかからないとします。
リスクは10/120=1/12
オッズは10/110=1/11です。
ワクチンを受けることによるリスク比は、
1/12 ÷ 1/6 = 1/2、リスクは50%になりました。
オッズ比は、
1/11 ÷ 1/5 = 5/11 =0.45, オッズは45%になりました。
比をとっただけです。
リスク比からオッズ比が計算できるか?
リスク比からオッズ比を計算することはできません。逆も然り。
具体的に考えてみれば簡単です。
リスク比 = 0.5の状況を考えます。
1/4 ÷ 1/2 = 1/2かもしれないし、
1/6 ÷ 1/3 = 1/2かもしれません。
上のオッズ比は1/3 ÷ 1/1 = 1/3で、
下のオッズ比は1/5 ÷ 1/2 = 2/5です。
違いますね。
つまり計算できないということです。
*当前ですが、2つのリスクが分かってればリスク比もオッズ比も計算できるし、
2つのオッズがわかっていればリスク比もオッズ比も計算できます。
なぜオッズ比が大事か?
logistic regressionでオッズ比が計算されるからです。
例えばアスピリン投与による3年間の死亡率の違いを検討するとします。
交絡因子として性別、年齢、心筋梗塞の既往を考えてロジスティック回帰をすると
Log(死亡のオッズ)=β0+β1*アスピリン+β2*性別+β3*年齢+β4*心筋梗塞の既往
(β0〜β4は何らかの数値)
となりますね。
性別、年齢、心筋梗塞の既往が同じで、アスピリンが違うだけの集団で左辺・右辺とも差をとると、
左辺はLog(アスピリン有り集団の死亡のオッズ)– Log(アスピリン無し集団の死亡のオッズ)
右辺はβ1
になります。
Logの差はLogの中身の比になるので、
Log(死亡のオッズ比)=β1
よって、
死亡のオッズ比=exp(β1)
となりオッズ比が計算されるのです。
なぜ左辺がLogなのかということ、こういう事なのです。
左辺の比が右辺の差で表せるから!
考えた人頭いいですよね。
****
さて、「なぜそもそも死亡のオッズが左辺なの?」と思うでしょう。
もし死亡のリスクが左辺だったらリスク比が計算できて、オッズ比より感覚的にわかりやすいのに。
なぜわかりにくいオッズ比にしているのか?
最初に説明したとおり、
リスクは0から1の間
オッズは0から+∞
の値を取ります。
すると
Logリスクは−∞(Log 0)から0(Log 1)の間
Logオッズは−∞から+∞(Log+∞)の間
をとります。
ちょっと右辺を考えてみると、
右辺は(係数✕因子)が単純に+で繋がれている式なので、値としては−∞から+∞を取りうる(取りたい)わけです。
仮に左辺がLogリスクだったら、上限は0にならねばなりません。でも算数でそんなの保証されませんね。だからモデルとしては正確性に欠けます。
なのでLog オッズなのです。
実はLogistic regressionでリスクは計算できるが・・
各々のsample(参加者)については、Logisticモデルの式の右辺を計算することで、Logオッズがわかります。
オッズがわかるので、リスクもわかります。
その人のリスクがわかるわけです。
でも求めたいリスク比はわかりません。
そもそもLogistic modelというモデルに当てはめて、「年齢・性別・心筋梗塞の既往が同じでアスピリンの有無だけ異なる時に、死亡リスク・オッズがどれほど異なるか」という事を考えているわけです。
求めたいオッズ比はとは一つの値でありLogistic regressionのβ1です。
どうやってリスク比を求めるのでしょうか。導出不可能なのです。
もしできるんなら皆使ってますよね。
まとめ
研究ではLogistic regressionを多用するため、オッズの理解が必要です。
Logistic regressionは大変光明な手段でオッズ比を計算しています。リスク比は計算不能です。
ではまた。