オッズ比とリスク比の違い、ロジスティック回帰の原理

オッズ比とリスク比。よく混同される違いで、大事です。

この違いはロジスティック回帰の原理とも関連します。

これを説明されているサイトを頻繁にみますが、この記事ではよりわかりやすく、プラクティカルに説明しました。

 

オッズとリスクの違いをインフルエンザで説明する

オッズとリスクの違いをインフルエンザで説明する

病気にかかるリスクを考えましょう。

1年で120人の内20人がインフルエンザにかかるとします。

インフルエンザにかかる確率=リスクは、20/120=1/6です。

オッズはというと、かかる人÷かからない人なので、20/100=1/5です。

 

リスクがわかればオッズが簡単に計算できますね。

大事なポイントは、

リスクは確率なので0~1の間。

オッズは1以上にもなりうる(最大+∞)。

ということです。

 

インフルエンザにかかる人の方がかからない人より多かったら、オッズは1を越えますよね。

 

 

オッズ比とリスク比の違いをインフルエンザで説明する

ワクチンを受けた人は、120人の内10人しかかからないとします。

リスクは10/120=1/12

オッズは10/110=1/11です。

 

ワクチンを受けることによるリスク比は、

1/12 ÷ 1/6 = 1/2、リスクは50%になりました。

オッズ比は、

1/11 ÷ 1/5 = 5/11 =0.45, オッズは45%になりました。

 

比をとっただけです。

 

リスク比からオッズ比が計算できるか?

リスク比からオッズ比を計算することはできません。逆も然り。

 

具体的に考えてみれば簡単です。

リスク比 = 0.5の状況を考えます。

1/4 ÷ 1/2 = 1/2かもしれないし、

1/6 ÷ 1/3 = 1/2かもしれません。

上のオッズ比は1/3 ÷ 1/1 = 1/3で、

下のオッズ比は1/5 ÷ 1/2 = 2/5です。

違いますね。

つまり計算できないということです。

 

*当前ですが、2つのリスクが分かってればリスク比もオッズ比も計算できるし、

2つのオッズがわかっていればリスク比もオッズ比も計算できます。

 

 

なぜオッズ比が大事か?

なぜオッズ比が大事か?

logistic regressionでオッズ比が計算されるからです。

 

例えばアスピリン投与による3年間の死亡率の違いを検討するとします。

交絡因子として性別、年齢、心筋梗塞の既往を考えてロジスティック回帰をすると

Log(死亡のオッズ)=β0+β1*アスピリン+β2*性別+β3*年齢+β4*心筋梗塞の既往

(β0〜β4は何らかの数値)

となりますね。

 

性別、年齢、心筋梗塞の既往が同じで、アスピリンが違うだけの集団で左辺・右辺とも差をとると、

左辺はLog(アスピリン有り集団の死亡のオッズ)– Log(アスピリン無し集団の死亡のオッズ)

右辺はβ1

になります。

 

Logの差はLogの中身の比になるので、

Log(死亡のオッズ比)=β1

よって、

死亡のオッズ比=exp(β1)

となりオッズ比が計算されるのです。

 

なぜ左辺がLogなのかということ、こういう事なのです。

左辺の比が右辺の差で表せるから!

考えた人頭いいですよね。

 

****

 

さて、「なぜそもそも死亡のオッズが左辺なの?」と思うでしょう。

もし死亡のリスクが左辺だったらリスク比が計算できて、オッズ比より感覚的にわかりやすいのに。

なぜわかりにくいオッズ比にしているのか?

 

最初に説明したとおり、

リスクは0から1の間

オッズは0から+∞

の値を取ります。

 

すると

Logリスクは−∞(Log 0)から0(Log 1)の間

Logオッズは−∞から+∞(Log+∞)の間

をとります。

 

ちょっと右辺を考えてみると、

右辺は(係数✕因子)が単純に+で繋がれている式なので、値としては−∞から+∞を取りうる(取りたい)わけです。

 

仮に左辺がLogリスクだったら、上限は0にならねばなりません。でも算数でそんなの保証されませんね。だからモデルとしては正確性に欠けます。

なのでLog オッズなのです。

 

 

実はLogistic regressionでリスクは計算できるが・・

各々のsample(参加者)については、Logisticモデルの式の右辺を計算することで、Logオッズがわかります。

オッズがわかるので、リスクもわかります。

その人のリスクがわかるわけです。

 

でも求めたいリスク比はわかりません。

そもそもLogistic modelというモデルに当てはめて、「年齢・性別・心筋梗塞の既往が同じでアスピリンの有無だけ異なる時に、死亡リスク・オッズがどれほど異なるか」という事を考えているわけです。

求めたいオッズ比はとは一つの値でありLogistic regressionのβ1です。

どうやってリスク比を求めるのでしょうか。導出不可能なのです。

もしできるんなら皆使ってますよね。

 

 

まとめ

研究ではLogistic regressionを多用するため、オッズの理解が必要です。

Logistic regressionは大変光明な手段でオッズ比を計算しています。リスク比は計算不能です。

ではまた。

-疫学・臨床研究

Copyright© Riklog , 2020 All Rights Reserved Powered by AFFINGER5.