「コホート」とか「疫学研究」とか聞いて、鳥肌が立つ人もいると思います。
私も数年前はそうでした。
そんな私が疫学研究の手法について、かなり噛み砕いて解説します。
具体的には、コホート研究、ランダム化研究、メタ解析がどのようなものか、なんとなくわかるようになります。
健康情報を判断する際にとても大事ですよ。
Contents
疫学研究の手法をまとめると、こうだ

コーヒーは乳がんを減らすか
運動すると寿命が伸びるか
〇〇すると✗✗か、という因果関係を証明する方法が、疫学研究です。
しかし疫学研究は、その方法(デザイン)によって信頼度が異なります。
信頼できる結果を生み出す疫学研究も、それだけでは信頼できない結果(仮説)を生み出す疫学研究もあるのです。
これを知っておくのは非常に大事です。
単純化すると、疫学研究は信頼度の高い順にこのようになります。
Umbrella review>メタ解析>ランダム化研究>コホート研究>横断研究>ケースシリーズ>症例研究>エキスパートオピニオン
これらがどのようなものか説明するのが、本記事の目的です。
信頼度の低い順に説明していきます。
エキスパートオピニオンとは
▷糖尿病患者を1万人みた経験上、コーヒーは糖尿病の進行を抑制すると考えている。
エキスパートオピニオンとは、権威のある人の意見です。
権威のある人とは、大抵教授レベルのエキスパートです。
最も信頼度が低いとされるエビデンスです。
信頼度が低いので、普通論文になりません。
非常に国際的に認知度が高いエキスパートの意見は、論文になることがありますが、何かの根拠になることはほとんどありません。
ましてや、一医者や一専門家の意見は、信用するに足りません(より高次元なエビデンスに基づいている場合を除く)。
「誰々が〇〇と言っていた」という理由で信じるのは、基本やめましょう。
*一方、医者の診療上は、エビデンスが無い細かいことというのはたくさんあります。
そういうのは大抵、今までの経験や上司の経験を参考にdecision makingします。
これが正しいかはわかりませんが、今まで問題なかったから問題だろうと考えます。
症例報告とは
症例報告とは「〇〇と〇〇の関連性が示唆された特徴的な症例」です。
▷例えば、「若年なのにコロナウイルスで死亡した症例」です。
この報告により「若年でもコロナウイルスでし得る」という事がわかります、
が、ほとんどの事象は〇〇し得るわけです。
・非常に致死率の高いエボラウイルスに感染しても完治し得る
・小児でも心筋梗塞になり得る
・非常に健康的な生活習慣を送っていても、若年で脳梗塞になり得る
→〇〇し得ることが分かっても、意味合いはあまりありません。
→症例報告により、そういう事があったのは世の中に知れ渡りますが、その報告から示唆される内容はあまりありません。
(世界で初めて報告された「ある治療法の副作用」等はインパクトがありますが)
*例えば「コーヒーを1日5杯飲み続けた人が110歳まで生きました」という症例報告があったとします。
でもそれで「そうか、コーヒーを飲めば長生きできるのか」とはなりませんよね。
その人が様々な健康的な要素があったからこそ、110歳まで長生きできたわけで、コーヒーを飲みまくって70歳で亡くなってしまう人ももちろんいるわけです。
なので、症例報告から「コーヒーの健康効果」を言及することはできません。
ケースシリーズとは
ケースシリーズは特徴的な症例を数人〜数十人まとめた報告です。
▷私が発表した症例研究・ケースシリーズを紹介します(J Med Case Rep. 2015;9:111.)。
患者さんは35歳男性で、肉じゃがをフライパンで熱したまま10時間寝てしまい、起きたら部屋中が煙だらけで呼吸困難となっていたため救急要請されました。重症の肺水腫という診断でICU管理となりましたが、速やかに回復しました。
この肺水腫の原因が、フライパンのPTFEコーティングが熱せられて生じた毒性ガスだと考えられたのですが、そのような報告は稀でした(症例研究)。
今まで報告されていたPTFEによる肺水腫を10例弱reviewした所、特徴的な肺CT所見があり、比較的予後が良いことがわかりました(系統的レビューを行った上でのケースシリーズ)。
→この報告は、PTFEによる肺水腫というのが非常に稀なので、そういう症例を経験した際には参考になるかもしれない程度のエビデンスとなるかもしれません。しかし10人程度の経過が良好でも、次の患者はどうなるかわかりません。
横断研究とは
▷2020年、1万人にアンケート調査しました。
2000人が糖尿病あり、3000人がコーヒーを1日3杯以上飲んでいました。
糖尿病の2000人中1000人(50%)がコーヒーを3杯以上のみ、糖尿病でない8000人中2000人(25%)がコーヒーを3杯以上飲んでいることが分かりました。
よって「糖尿病の人はコーヒーを飲む人が多いこと」わかりました。
これが横断研究です。
ある一時点での、〇〇と✗✗の関連性をみる調査です。
重要なポイントは、〇〇だから✗✗だと言うことはできない点です(因果関係は言えない)。
だって今コーヒーを飲んでいる人と、今までコーヒーを飲んできた人は違いうから。
ある一時点の単純な相関関係しかわかりません。
*横断研究は、色々な因子で調整した場合(後述)、因果関係を示唆します。コホートやランダム化研究を行うきっかけとなります。
コホート研究とは

コホートとは、数千〜数万人くらいの集団を数年間フォローしたデータです。
コホートを使った研究をコホート研究といいます。
▷赤肉の摂取と死亡率の関連を調べた、ハーバードの研究があります(BMJ 2019;365:l2110)。
・まずコホートを作ります。ある人は1980年にエントリー、違う人は1981年にエントリー、という感じで、数万人集めます。
→エントリーした全ての人に、1年間でどのような食事を平均してとっているかのアンケート調査を2年ごと、運動習慣のアンケートを2年ごと、血液検査をエントリー時に一回、みたいに行います。
→1年間に一回、参加者が病気にかかったかのアンケート調査を行い、いつ死亡したり癌にかかったりしたかの情報収集を行います。
→すると、参加者10万人の1980年から2019年までの情報が蓄積されます。ここまでがその「コホート」の管理者が、莫大なお金をかけて行う事です。
・その貴重なデータを使って、疫学者が研究(コホート研究)を行います。この研究では、8年越しに赤肉の摂取量が増えたか減ったかが、その後の死亡率に関わるか、ということを調べています。
→全ての参加者で、アンケートを元とした1986年と1994年の赤肉摂取量(1日何回食べるか)を比較して、増えた人、変わらない人、減った人、と群わけします。
→そして、1994年から2010年の死亡率を、群毎に比べるわけです。
★色々な因子で調整した解析を行う、という非常に重要な点があります。
赤肉摂取量が増えた人は、赤肉摂取量が減った人と比較して、他の食事摂取も変化しているし、運動習慣も悪いかもしません。なので、単純に赤肉摂取量の違いが死亡率の変化に繋がった、とは言えないわけです。
どうするのか。回帰モデルを使って、「年齢、性別、他の食事摂取、運動量、喫煙、BMIなどが同じとして、赤肉摂取量の変化だけが群間で違う時に、死亡率に差があるか」ということを調べるわけです。
もしその解析で「赤肉摂取量が増えた人が死亡率が高い」という結果になれば、おそらく赤肉摂取量が増えたせいで死亡率が高まったのだろう、と推測されます。
→しかし、「〇〇が同じとして」という〇〇を、全て調整することは不可能です。
例えば、細かい内服薬が違うかもしれないし、そもそもの健康意識が違うかもしれません。職業も違うかもしれません。
実は赤肉摂取量の変化でなく、この「〇〇」に入れていない因子が死亡率に寄与しているのかもしれないわけです。
→この可能性が常に拭いきれないので(バイアスが取り切れていない可能性がある)、コホート研究はエビデンスレベルが低いとされています。
ランダム化研究とは

▷ビタミンDのサプリが癌・心血管疾患予防に有効かを研究した、有名な論文を解説します(N Engl J Med 2019;380:33-44.)。
これは、2万人の参加者をランダムにビタミンDかプラセボ(偽薬)を与え、その2群の癌発症率などを比較したものです。
結果、ビタミンDの群はプラセボ群と比較して、明らかに癌発生率が低かった、ということはなかったのです。
なぜこれが(コホート研究より)強力な手法なのでしょうか?
それは、ビタミンDを飲む群とプラセボの群が、ほとんど同じ集団だと仮定できるからです(ランダムに決まっているから)。
・例えば、健康意識の高さについても、健康意識が高い人も低い人もランダムにビタミンDか偽薬に分類されるので、その頻度は同じくらいになります。同様に、何についても、ランダム化すれば2群は同じくらいの出現頻度となります。
・コホート研究の場合、「健康意識の高さ」という具体的な評価項目が無いと、2群を同じ条件にして解析することができません。
→「2群が同じ条件」ということは、「ビタミンDが癌発症に寄与する」という因果関係を言うために必要です。
先程説明したように、コホート研究では、死亡率の差が赤肉摂取量を原因とするかもしれないし、調整していない他の因子を原因とするかもしれません。
しかし、ランダム化研究では、癌発症率の差はビタミンDサプリの摂取有無を原因とする、と結論できるのです。
よって、因果関係をより信頼性高く言及することができるという点で、ランダム化研究が優れています。
※しかし、ランダム化研究にも質があります。
・例えば10人をランダムにビタミンDか偽薬に振り分けたとしましょう。すると、確率的に、タバコを吸う人は4人:6人かもしれないし、運動しない人は3人:7人となってしまうかもしれません。すると、この2群は「同じくらいの特徴を持つ集団」とはとても言えません。よって、因果関係を言及することはできません。
・また、ランダム化試験がロシア人のみを対象としたものかもしれません。すると、その結果を日本人に応用できるかはわかりません。例えばビタミンDは日光を浴びることで産生できるのですが、ロシアは日照時間が少ないため、十分なビタミンDを体内産生できていない人が多いかもしれません。すると、ビタミンDのサプリはとても効果があるかもしれません。一方、日本人は日光浴だけで十分なビタミンDを体内合成できているので、サプリでさらに摂取しても健康効果はないかもしれません。
こういったlimitationが、ランダム化試験でもいくつかあります。
こういう事も考えて、ランダム化試験の結果の理解をする必要があります。
メタ解析とは

メタ解析とは、例えばビタミンDと癌の関係をみたたくさんのランダム化試験の結果を、まとめて解析する手法です。
先述のように、ランダム化試験でもlimitationがありますが、20個の同じ目的のランダム化試験を全部まとめて解析することで、より信頼性の高い情報を提供できるかもしれません。
単純に対象人数が増えるため、2群がフェアな比較となる可能性が上がるし、ロシアの研究と日本の研究をあわせることで、世界中の人に適用できる結果を出すこともできます。
※しかし、メタ解析は様々な情報を失うことに注意が必要です。
例えば、ビタミンDはロシア人には効くけど日本人には効かない、という情報は極めて重要なわけです。が、メタ解析とするとその情報が失われてしまいます。
→「どういうサブグループで違う効果があるか」というのは、疫学上effect modificationと言われますが、メタ解析でeffect modificationを調べるのは難しいのです。重要なポイントです。
その他にも、メタ解析にlimitationがあります。詳細はこちらを参照下さい。
Umbrella reviewとは

umbrella reviewは最近出てきた手法です。これは、メタ解析のメタ解析と言われます。
例えば「コーヒーの健康効果」に関するメタ解析を網羅的に調べ、その信頼性を評価します(BMJ 2017;359:j5024)。
健康効果、とは様々な定義があります(こちら参照)。死亡率、心筋梗塞、〇〇癌、肝硬変、糖尿病、認知症、、、などなど。
メタ解析とは、「コーヒーと心筋梗塞の10論文の解析」「コーヒーと肝硬変の7論文の解析」などを指します。
→心筋梗塞のメタ解析、肝硬変のメタ解析、糖尿病のメタ解析、、、などを全てひっくるめて解析する手法が、Umbrella reviewといいます。
具体的には「メタ解析はコーヒーにより心筋梗塞を10%予防する結果となっているが、それはどれくらい信頼できるのか」ということを、延々と全てのアウトカムについて評価します。
メタ解析にも質があるので、メタ解析で結果が出ても、信頼性が低いかもしれないためです。
Umbrella reviewは最終的に、「コーヒーにより〇〇と▲▲は予防できるが、☓☓は予防できない。□□はむしろ発症率を増やしてしまう。結局、1日▽杯なら安全で健康効果も期待できる」という結論を出すことができます。
この結論が、その論文出版時点で、最も信頼できる結論に近い、と考えられるわけです。
結論
コホート研究、ランダム化試験、メタ解析、Umbrella reviewがどのようなものか紹介しました。
これを知っておくと、このブログで紹介している情報がどういうものかイメージがつき、批判的に情報を解釈することができます。
ではまた。