感度、特異度、陽性的中率などの重要事項【例:コロナ検査】

感度、特異度、陽性的中率、陰性的中率、尤度比など。

特にコロナ検査を例に、日常レベルでも議論されるようになりました(きっと)。

基本は中学数学レベルの話ですが、見落とされがちな大事なポイントがいくつかあります。

この記事ではそれらをわかりやすくまとめました。

 

 

感度、特異度、陽性的中率などの計算方法

感度、特異度、陽性的中率などの計算方法

まず。

感度(Sensitivity):病気のある人が、正しく「病気あり」と診断される確率

→略してSen(この記事で)

特異度(Specificity):病気のない人が、正しく「病気なし」と診断される確率

→略してSpe(同様)

 

以上は常識です。

この2つの指標は「その検査の特性」なので、検査ごとに値がfixしている、というのが前提です。

*ここに注意ポイントがあります(後述)

 

例えばコロナのPCRは、感度が70%くらい、特異度が99%くらいと言われています。

 

***

続きまして。

陽性的中率(Positive predictive value):検査が陽性だったときに、病気がある確率

→略してPPV

陰性的中率(Negative predictive value):検査が陰性だったときに、病気がない確率

→略してNPV

 

これが多くの場合知りたい値なわけですね。

この2つの値は「集団」に依存します!!!

→正確には、病気のPrevalence(略してPrev)に依存します

 

具体的には、ベイズの定理にてこうなるのでした:

PPV = Sen*Prev / (Sen*Prev + (1-Spe)*(1-Prev))

NPV = (1-Prev)*Spe / ((1-Prev)*Spe + Prev*(1-Sen))

 

OK?

 

***

例えば、コロナのPrevalenceが1%だったとします(日本で120万人感染しているという意味です)。

症状に関わらず、このgeneral populationを対象に検査を行った場合:

PPV = 0.7*0.01 / (0.7*0.01 +(1-0.99)*(1-0.01)) = 0.41

NPV = (1-0.01)*0.99 / ((1-0.01)*0.99 + 0.01*(1-0.7)) = 0.997

となります。

つまり、陽性なら4割くらいが実際に感染しており、陰性ならほぼ感染していない

 

一般的には、感度が低く特異度が高い検査は、「陽性ならほぼ病気あり、陰性だとあるかないか微妙」という結論になります

なぜそれと真逆の結果となったかというと、Prevalenceが低すぎる=事前確率が低すぎるから

こういうときに検査を行う意味はほとんど無いんです。

 

もし症状あり=事前確率が40%の集団を対象としていたら:

PPV = 0.7*0.4 / (0.7*0.4 +(1-0.99)*(1-0.4)) = 0.98

NPV = (1-0.4)*0.99 / ((1-0.4)*0.99 + 0.4*(1-0.7)) = 0.83

となり、陽性ならば感染あり、陰性だとほぼ感染なし、となります。

***

なお、陰性の信頼性がちょっと甘いので、「2回陰性」を確認する理由になります。

→2回目のNPVは、事前確率が1-0.83 = 0.17ということなので

(1-0.17)*0.99 / ((1-0.17)*0.99 + 0.17*(1-0.7)) = 0.94

となりますね。

 

 

ややマイナーな指標

これらも押さえておきましょう。

 

False positive fraction (FPF) = 1 - Spe

これは簡単ですね。

ROC curveのx軸です。

 

Positive likelihood ratio(陽性尤度比)= Sen/(1-Spe) = PPV/Prev

病気がある人は、そうでない人と比べ、どれだけ検査陽性となりやすいか。

 

Negative likelihood ratio(陰性尤度比)= (1-Sen)/Spe = NPV/Prev

病気がない人は、ある人と比べ、どれだけ検査陰性となりやすいか。

 

Positive likelihood ratioが10以上、Negative likelihood ratioが0.1以下の場合、「Clinical judgementを変える」とされています(だいたい)。

→rule in/ rule outの指標となりうる、ということです。

 

 

感度、特異度、陽性的中率などの確認事項

これが大事です。

 

✅感度、特異度は「同じような集団」で計測されているか

これ、見落とされがち+かなり重要なポイント。

感度と特異度は、大抵、少ないサンプル(数百程度)かつ限定されたシチュエーションで計算されます。

これが、検査性能を一般化できないことにつながりうるのです(Eur J Epidemiol. 2021;36(2):179-196.)。

 

例えば、入院中の患者でこれらが計算された場合。

→入院するほどの患者はコロナ重症患者が多い。

→必然的に、彼らは抗原量が多い

→極めてPCR陽性になりやすい。

→病気の人が正しく陽性と判断される確率が大きい状況

この検査を入院外の患者に使う場合、感度が過大評価されていることになる。

 

これはマジで重要で、かつ確かめるのが難しい話。

念頭に置いておきましょう。

 

 

✅Prevalenceや事前確率は、その集団で一定か

PPVとNPVを計算するときにPrevalenceが必要ですが、その集団で一つのPrevalenceの値しか使えません。

つまり、「その集団のどこを切り取ってもPrevalenceが同じだ」ということが、この計算式のAssumptionとなっています。

 

・あそこはコロナが多いけど、ここは少ない

という場合、それぞれ分けて計算しないとダメです。

・医者による事前確率の推定も、だいたいです

→よって、PPVもだいたいでしかありません。

 

 

まとめ

感度や特異度は検査の性能だが、その値を鵜呑みにできない。

Prevalenceについても、本当に均等に分布しているか評価が必要。

ではまた。

-疫学・臨床研究

Copyright© Riklog , 2021 All Rights Reserved Powered by AFFINGER5.