疫学研究・臨床研究の論文のTable 1。最近p値を表示していないものをよく見ませんか?
でもp値があったほうがわかり易くないですか?
このTable 1でp値を書くべきか問題について、この記事で解説しました。
Table 1でp値がない?!
疫学研究・臨床研究の論文でTable 1とはその集団の特徴を表すものです。
多くは2群又は3群の比較がメインテーマであり、それぞれの特徴を対比するように情報をまとめます。
比較というと検定→p値で表現され得ますね。
実際、多くの論文でTable 1にp値を見ます。
Table 1のp値。これは結構見やすいです。
年齢はp=0.80、群間に差はなし。
性別はp=0.10、男性の割合にちょっと差はあるが、有意差はなし。
高血圧罹患はp=0.01、治療群に多い。
など。
でも最近の論文(特にトップジャーナル)ではTable 1にp値をみません。
治療群とコントロール群の、年齢の平均±SDのみ書いてあり、そのt検定の結果は書いてありません。
ちょっと見にくいのですが。。。
なぜp値が表示されなくなったのでしょうか。
p値の解釈を見直そう
年齢がコントロールで平均60歳、治療群で64歳、p値が0.03だったとします。
この意味は「真実はこの2群で年齢に差がないのにも関わらず、これほどの(平均4歳以上の)差が出てしまう確率が3%だ」ということです。
→3%は低いので、差はあると言えるだろうということです。
この解釈ができれば、別にp値が表示されていても全く構わないわけです。
問題なのは、p<0.05で「差あり/なし」と結論してしまう人達です。
Multiple testingが問題である
pが0.05未満か以上かだけで差を判断することを、ネイマン・ピアソンの仮説検定といいます。
これはわかりやすく、臨床医に好まれています。
わかりやすい反面、p値の解釈を無視してしまいます。
ネイマン・ピアソンの仮説検定は1回の検定であれば問題は少ないのですが、複数回やると問題となります。
Multiple testingといわれます。
5回検定したら・・・?
1回も間違った結論を出さない確率は、0.95の5乗=0.77、77%となります。
Table 1にp値は15回くらい出てくるでしょうか。
これが問題となるのです。
実際、2群に差がないだろう大規模ランダム化研究でも、Table 1には少なくとも1回くらいp<0.05の項目が出てくるはずです。
当然ですね。Table 1にp値は15回くらい出てくるなら、1回も間違った結論を出さない(母集団に差がない)確率=全てp>0.05である確率は、0.95の15乗=0.46、46%なのです。
p値だけで差を判断しないでくれ
p値が0.05未満か以上かだけで差を判断しないでください。
そうする人が多いから、Table 1にp値が掲載されていません。
p値も大事ですが、平均や中央値の差もとても重要です。
pがいくら低かろうと、差が大した事なければ、実質ほとんど意味ありませんね。
NEJMなどはp値を掲載しないようなeditorial policyですが、特に臨床医向けの医学誌の場合、p値を書かないことはmisleadingを防ぐために必要かもしれません。
まとめ
p値はちゃんと解釈できれば問題になりません。
解釈できない人が多いことが問題です。
ではまた。