時々出てくるSMR。
普段オッズ比やハザード比ばかり使うので、よく知らない方も多いと思います。
この記事ではSMRの概念と使い方をわかりやすく解説します。
後半に、慣れている人向けに、counterfactualの数式を用いてSMRを表しています。
Standardized Mortality Ratio (SMR)って何?
SMRとは、日本語では「標準化死亡比」。
まずこれを一言で言うと、
SMRとは、実際の死亡者数 ÷ 期待される死亡者数
です。
より正確には、
「暴露因子A→死亡」の因果関係を検証するに当たって、
「Aに暴露されている群の死亡者数 ÷ 彼らがもしAに暴露されていなかったら、とした時の死亡率」
となります。
これをしっかり説明していくので、ご安心下さい。
*なお、このように「死亡」をアウトカムとした際の指標がSMR (M=mortality, 死亡ですね)で、「疾患発症」をアウトカムとしたものをSIR(I=incidence, 発症ですね)といいます。
→この2つは同じコンセプトで計算されます。アウトカムが違うだけ。
SMRを計算してみよう
まず重要な概念は、SMRはincidence rateを基準とした指標だ、ということです。
この記事で詳細を解説していますが、incidence rateとは「発症数 ÷ 総person-time」で、疫学研究の基本的な「発症率」の考え方です。
*例えばincidence rate = 40 / 1000 person-yearであれば、
・100人を10年フォローしたら40人が発症する
・1000人を1年フォローしたら40人が発症する
と同義となります。
では計算式を出しますよ〜〜
SMR = {「Incidence rate * person-time」の各グループの和} ÷
{「標準のIncidence rate * person-time」の各グループの和}
この意味をゆっくーり見ていきます。
まず分子
{「Incidence rate * person-time」の各グループの和}
まず最初に気になるのは、
各グループってなんやねん
ということだと思います。
これは例えば、
・年齢(5歳刻み)と性別の組み合わせのグループ
です。
だって死亡率って、30~35歳と70~75歳では、天と地ほどの差があるじゃないですか。
だから、グループを作って、グループごとに計算するんです。
OK?
*これは「交絡因子の調整」という概念そのまんまです。当然、上のグループ化では、年齢と性別しか調整されません。
→何の因子でグループ化(層別化)しているかは、論文を読む上でとても大事です。
***
さて、分子(と分子)の対象は、暴露因子に暴露されている群です。
これは超超大事です。
彼らをグループ化し、
それぞれのincidence rate * person-time
を計算、最後に足している。
でもincidence rateって、
総死亡数 ÷ person-time
だったじゃないですか。
だから分子は、
それぞれのグループの総発症数の和
なのです。
なんでそう書かなかったんかい、という理由は、分母と対にしているためです
分母を見る
「標準のIncidence rate * person-time」の各グループの和
ほぼ分子と同じですが、違いは「標準の」という点。
これは
「もし暴露因子に暴露されていなかったら」とした時の、暴露因子に暴露されている人のincidence rate
です。
つまりcounterfactualですね。
これが本来の定義なのですが、よく使われるのは
「一般の集団におけるincidence rate * person-time」の各グループの和
です。
*これは暴露因子が一般集団で稀であればOKなのがすぐわかると思います。
実際そのようなケースが多いです。
ただ、暴露因子が一般集団においても頻度が高いと、意味するものが異なってきます。要注意
SMRの解釈は?
計算の方法はわかりました。
では解釈は?
暴露群に標準化している、つまり
「暴露群において、実際の発症数 ÷ 暴露因子がなかった時に期待される発症数」
ということになります。
基本的に以上ですが、
これはcounterfactualの数式を用いると、より明確です。
(慣れている人向けです)
Counterfactualの数式で表す
まず、よくロジスティク回帰で求めている「オッズ比」は何を表しているのか。
Aを暴露因子、Yをアウトカム(それぞれ1か0)、Lを交絡因子とすると、
オッズ比=Pr [Y=1 | A=1, L] / Pr [Y=1 | A=0, L]
です。
ここでcounterfactualの世界にちょっと踏み込んで、
independency: Ya _II_ A (YaとAが独立)
と
consistency: Pr[Ya=1|A=a] = Pr[Y=1|A=a]
が成り立つとしたら、
*Yaとは、仮にA=a (aは0か1)だったとしたときのYの値、ということを意味します
オッズ比=Pr[Ya=1=1|L] / Pr[Ya=0=1|L]
となるのでした。
詳細はいつか解説します。
で、SMRが何を意味するかというと、
Pr[Ya=1=1|A=1] / Pr[Ya=0=1|A=1]
なのです。
ポイントは、
・「|L」がない
・「|A=1」がついている
というところです。
わかる方にはこちらの方がわかりやすいですね。
***
以上SMRの説明でした。
ではまた。