感度、特異度、陽性的中率、陰性的中率、尤度比など。
特にコロナ検査を例に、日常レベルでも議論されるようになりました(きっと)。
基本は中学数学レベルの話ですが、見落とされがちな大事なポイントがいくつかあります。
この記事ではそれらをわかりやすくまとめました。
感度、特異度、陽性的中率などの計算方法
まず。
・感度(Sensitivity):病気のある人が、正しく「病気あり」と診断される確率
→略してSen(この記事で)
・特異度(Specificity):病気のない人が、正しく「病気なし」と診断される確率
→略してSpe(同様)
以上は常識です。
この2つの指標は「その検査の特性」なので、検査ごとに値がfixしている、というのが前提です。
*ここに注意ポイントがあります(後述)
例えばコロナのPCRは、感度が70%くらい、特異度が99%くらいと言われています。
***
続きまして。
・陽性的中率(Positive predictive value):検査が陽性だったときに、病気がある確率
→略してPPV
・陰性的中率(Negative predictive value):検査が陰性だったときに、病気がない確率
→略してNPV
これが多くの場合知りたい値なわけですね。
この2つの値は「集団」に依存します!!!
→正確には、病気のPrevalence(略してPrev)に依存します
具体的には、ベイズの定理にてこうなるのでした:
PPV = Sen*Prev / (Sen*Prev + (1-Spe)*(1-Prev))
NPV = (1-Prev)*Spe / ((1-Prev)*Spe + Prev*(1-Sen))
OK?
***
例えば、コロナのPrevalenceが1%だったとします(日本で120万人感染しているという意味です)。
症状に関わらず、このgeneral populationを対象に検査を行った場合:
PPV = 0.7*0.01 / (0.7*0.01 +(1-0.99)*(1-0.01)) = 0.41
NPV = (1-0.01)*0.99 / ((1-0.01)*0.99 + 0.01*(1-0.7)) = 0.997
となります。
つまり、陽性なら4割くらいが実際に感染しており、陰性ならほぼ感染していない。
一般的には、感度が低く特異度が高い検査は、「陽性ならほぼ病気あり、陰性だとあるかないか微妙」という結論になります。
なぜそれと真逆の結果となったかというと、Prevalenceが低すぎる=事前確率が低すぎるから。
こういうときに検査を行う意味はほとんど無いんです。
もし症状あり=事前確率が40%の集団を対象としていたら:
PPV = 0.7*0.4 / (0.7*0.4 +(1-0.99)*(1-0.4)) = 0.98
NPV = (1-0.4)*0.99 / ((1-0.4)*0.99 + 0.4*(1-0.7)) = 0.83
となり、陽性ならば感染あり、陰性だとほぼ感染なし、となります。
***
なお、陰性の信頼性がちょっと甘いので、「2回陰性」を確認する理由になります。
→2回目のNPVは、事前確率が1-0.83 = 0.17ということなので
(1-0.17)*0.99 / ((1-0.17)*0.99 + 0.17*(1-0.7)) = 0.94
となりますね。
ややマイナーな指標
これらも押さえておきましょう。
✅False positive fraction (FPF) = 1 - Spe
これは簡単ですね。
ROC curveのx軸です。
✅Positive likelihood ratio(陽性尤度比)= Sen/(1-Spe) = PPV/Prev
病気がある人は、そうでない人と比べ、どれだけ検査陽性となりやすいか。
✅Negative likelihood ratio(陰性尤度比)= (1-Sen)/Spe = NPV/Prev
病気がない人は、ある人と比べ、どれだけ検査陰性となりやすいか。
Positive likelihood ratioが10以上、Negative likelihood ratioが0.1以下の場合、「Clinical judgementを変える」とされています(だいたい)。
→rule in/ rule outの指標となりうる、ということです。
感度、特異度、陽性的中率などの確認事項
これが大事です。
✅感度、特異度は「同じような集団」で計測されているか
これ、見落とされがち+かなり重要なポイント。
感度と特異度は、大抵、少ないサンプル(数百程度)かつ限定されたシチュエーションで計算されます。
これが、検査性能を一般化できないことにつながりうるのです(Eur J Epidemiol. 2021;36(2):179-196.)。
例えば、入院中の患者でこれらが計算された場合。
→入院するほどの患者はコロナ重症患者が多い。
→必然的に、彼らは抗原量が多い
→極めてPCR陽性になりやすい。
→病気の人が正しく陽性と判断される確率が大きい状況
→この検査を入院外の患者に使う場合、感度が過大評価されていることになる。
これはマジで重要で、かつ確かめるのが難しい話。
念頭に置いておきましょう。
✅Prevalenceや事前確率は、その集団で一定か
PPVとNPVを計算するときにPrevalenceが必要ですが、その集団で一つのPrevalenceの値しか使えません。
つまり、「その集団のどこを切り取ってもPrevalenceが同じだ」ということが、この計算式のAssumptionとなっています。
・あそこはコロナが多いけど、ここは少ない
という場合、それぞれ分けて計算しないとダメです。
・医者による事前確率の推定も、だいたいです
→よって、PPVもだいたいでしかありません。
まとめ
感度や特異度は検査の性能だが、その値を鵜呑みにできない。
Prevalenceについても、本当に均等に分布しているか評価が必要。
ではまた。