疫学・臨床研究サイトマップ

ついにできました!

このブログの「研究手法」に関する主要な記事を、サイトマップとしてまとめました。

是非参考にしてください!!

 

*下のContents (目次)が見やすいので参照ください。

 

 

Contents

疫学の歴史

科学とか科学的理論って、そもそも何?【根本を考える】

どんな科学も、何かしらの仮説を証明するために行います。 その裏には理論があります。 でも、そもそも、科学や科学的理論って何なんでしょう。 この根源的な疑問を考えてみることは、研究をやっていく上でとても大事です。     ...

続きを見る

昔の人はどうやって健康を追求していたか

エビデンス、科学的根拠により健康を考えるようになったのは、つい最近のことです。 疫学という学問が発展したのは19世紀から。 それより昔の人はどうしていたのか? 誰しも「健康であること」には多大な関心があるものです。 この記事では、そんな歴史 ...

続きを見る

「うんこかどうか」から疫学は始まった。

今回は衝撃的な歴史の話です。 「うんこ」論争。 これを期に、疫学が発展しました。 うんこが感染症の原因なのか・・・。 臨床研究や疫学に取り組む方は特に、この「うんこ」論争、絶対に知っておきましょう。     Conten ...

続きを見る

疫学の因果推論、誰のコンセプトが正しい?【ハーバードで炎上】

ある因子と病気との因果関係を調べることが疫学の最もコアな部分で、その方法は因果推論と言われます。 因果推論は近年目覚ましい発達を遂げ、今やかなり数学的です。 しかしこの発展につき、実は熾烈な論争があります。 この記事を読むことで、疫学·因果 ...

続きを見る

 

 

効果判定の指標いろいろ

感度・特異度・AUCなど

感度、特異度、陽性的中率などの重要事項【例:コロナ検査】

感度、特異度、陽性的中率、陰性的中率、尤度比など。 特にコロナ検査を例に、日常レベルでも議論されるようになりました(きっと)。 基本は中学数学レベルの話ですが、見落とされがちな大事なポイントがいくつかあります。 この記事ではそれらをわかりや ...

続きを見る

Net Reclassification Improvement (NRI)の意味と目安【超解説】

NRI, 最近論文で多用されるようになってきました。 統計ソフトがあれば簡単に計算できるので、意味を知らずとも使ったことのある方、多くいるはず。 そんな方のために、この記事では「NRIの意味」について、わかりやすく解説してきます。 別に難し ...

続きを見る

Standardized Mortality Ratio (SMR)って何?

時々出てくるSMR。 普段オッズ比やハザード比ばかり使うので、よく知らない方も多いと思います。 この記事ではSMRの概念と使い方をわかりやすく解説します。 後半に、慣れている人向けに、counterfactualの数式を用いてSMRを表して ...

続きを見る

Attributable fractionって何?

疫学研究でよく使われる「attributable fraction」って知っていますか? 「このexposureによりイベント数が何倍になったか」を示す指標で、簡単に計算できます。 裁判でもこの値が長く使われてきた経緯があります。 しかし、 ...

続きを見る

 

Risk, rate, hazard

Ratio, proportion, rate, percentageの違い【科学的に正しい「比」の使い方】

ratio, proportion, rate, percentage:どれも「比」を意味しますが、実は意味が違います。 この記事ではこれら「比」の単語の科学的に正しい使い方を解説します。 *口語での使い方ではないので注意ください。 &nb ...

続きを見る

なぜhazardがrateの指標の一つなのか?【徹底解説】

COX proportional modelでハザード比がわかる。 incidence÷person-timeでrateやrate ratioがわかる。 全然異なる算出方法ですが、どちらも「rate」の指標なのです。 なぜ????? これを ...

続きを見る

オッズ比とリスク比の違い、ロジスティック回帰の原理

オッズ比とリスク比。よく混同される違いで、大事です。 この違いはロジスティック回帰の原理とも関連します。 これを説明されているサイトを頻繁にみますが、この記事ではよりわかりやすく、プラクティカルに説明しました。   Content ...

続きを見る

ハザード比ってなに?リスク比との違いは?【数式なし】

論文で本当によく用いられる指標、ハザード比。1-2割の論文で言及されているのでないでしょうか。 しかし「ハザード比ってなに?」という質問に答えられるでしょうか?リスク比との違いは? この記事では、ハザード比とは何かわかりやすく解説します。数 ...

続きを見る

 

Interaction・Effect modification

Interactionについて知る【徹底解説】

Interactionは「AのYに対する効果はCによって異なるか」を示す、非常に大事な指標です。 しかしinteractionを理解しようとすると、統計的に難しい記事が多く、挫折しがちです。 この記事ではinteractionをより広く理解 ...

続きを見る

Case-only estimatorの解説

ちょっとニッチかもですが、case-only estimatorについて解説します。 これは簡単にinteractionが計算できる代物。 主にgene-environment interactionで使われます。 知らないと??なので、解 ...

続きを見る

Effect modificationとは?【やさしい解説】

Effect modification、例えば一流医学誌に載るランダム化試験の、最後のFigureに書いてあるやつです。 実は論文によく出てきますが、体系的に勉強しないと意味がわかりにくいかもしれません。 この記事では、Effect mod ...

続きを見る

 

P値, 95%信頼区間

Table 1でp値を書くべきか書かないべきか【実践的な考え方】

疫学研究・臨床研究の論文のTable 1。 患者背景がまとめられる表です。 このTable 1、最近「p値を表示していないもの」をよく見ませんか? でもp値があったほうがわかり易くないですか?? このTable 1でp値を書くべきか問題につ ...

続きを見る

p値の完全解説【保存版】

p値は簡便ですが、かなり誤解・誤用されている統計指標です。この記事では、p値とは何か具体的に理解し、その上で最近のp値に関する論争・専門家の考え方を紹介します。この記事を読むことで、p値の正しい考え方と限界を具体的に理解することができます。

続きを見る

95%信頼区間を正しく計算し、解釈する

「95%の確率で、95%信頼区間の中に本当の値がある。」残念ですが、違います。この記事では、95%信頼区間の正しい計算方法と、その解釈を説明します。確認してみてください。

続きを見る

 

 

Prediction

Internal validationの種類について解説【まとめ】

予測モデルのvalidationには種類があります。 よく行われるのはdata splittingや10-fold cross-validationかと思います。 でもそれらには特有のlimitationがあり、使うべき手法は、実は決まって ...

続きを見る

External validationの方法いろいろ【まとめ】

予測モデルのvalidationというのは、そのデータ内で行うもの(internal validation)だけではありません。 むしろ、そのデータ外でどの程度通用するかというのが一番大事です。 これは予測モデルの「test」の話ですが、疫 ...

続きを見る

臨床研究のほとんどはCounterfactual predictionである【predictionとの違い】

予測モデルと因果推論の違い、段々と浸透してきています。 因果推論は実は、counterfactual predictionという「予測」の中の一つです。 そういう意味で、臨床試験のほとんどがcounterfactual prediction ...

続きを見る

 

 

因果推論

因果推論基礎

因果関係の意味について解説【2種類ある】

因果関係とは「〇〇が☓☓の原因であること」を意味しますが、「原因」とは何でしょうか。よく考えると混乱してきます。 アルコールを飲んで健康な人がいるのに、アルコールを飲むことと癌の因果関係があるといえるのでしょうか? 実はこれは「因果関係の意 ...

続きを見る

平均因果効果のコンセプトと限界

臨床研究・疫学研究ほぼ全ての論文は、‘平均因果効果’ という指標で「因果関係の度合い」を評価しています。’平均’ で良いのでしょうか?
この記事では、平均因果効果のコンセプト、その解釈、限界、将来の展望について説明・考察します。

続きを見る

 

Counterfactual基礎

Counterfactual(反事実現実)を理解する【因果推論入門1】

独学で因果推論を学ぼうと思うと、どの解説も難しく感じます。 ある程度勉強している私がそのような日本語の解説をみても難しく感じる程なので、初学者にはかなりハードルが高いかも知れません。 このシリーズ、誰でもわかるように、かなり噛み砕いて疫学や ...

続きを見る

観察研究の場合Counterfactualはこう考える【因果推論入門2】

前回の記事でCounterfactualについて紹介して、なんでランダム化試験だと因果効果が推定できるのかを示しました。 この記事では、観察研究での因果推論はどう考えるのか説明していきます。 観察研究での因果推論とは、8-9割くらいの臨床研 ...

続きを見る

 

DAG

DAGの限界:EMMとselection bias

DAG、疫学・臨床研究の分野では日夜使われています。 DAGは直接統計的な関連性を意味するので、因果推論理論のdeveloperでも共通言語です。 しかし、DAGには大きな限界があります。 この記事では、そんな限界について詳しく考えていきま ...

続きを見る

ConfoundingとSelection biasの違い

Confounding(交絡)とselection bias(選択バイアス)、どちらもsystematic biasの原因となる構造です。 この違い、当たり前のようで、実はわかりにくいのです。 この記事を読んで、はっきりとさせましょう。 & ...

続きを見る

データからだけでは因果関係は導けないんですよという話【シンプソンのパラドックス】

当たり前じゃん、と思われるかもしれませんが、世の中の機械学習系のリサーチは「データから因果関係を導く」ことを目標にしているものたくさんあります。 なぜデータだけでは因果関係が導けないか、実は1951年に分かっていたことなのです! いわゆる「 ...

続きを見る

DAGの真髄はMarkov factorizationだということの説明

DAG(directed acyclic graph)というのは疫学研究で頻繁に使われます。 というか、疫学研究そのものを図示したものと言えます。 これが、Markov factorizationという確率モデルを必要十分で表している、とい ...

続きを見る

 

Misclassification

Misclassificationの調整法を知ろう【中学数学レベル】

カテゴリー変数の情報が、誤っている可能性があるとき。 Misclassificationと言います。当然これがあると、正確な関連性を知ることができません。 このmisclassification、validation studyを使って調整 ...

続きを見る

Misclassificationのあるリスク比を調整する【高校数学レベル】

測定誤差があったとき、そしてvalidation studyの情報が利用可能なとき、実際にはどう計算したらよいのか。 R等ではパッケージで自動的に計算できますが、その論理背景を理解すれば、簡単に応用が効きます。 この記事では、misclas ...

続きを見る

 

Time-varying setting

Time-varying exposureの因果推論での目的をはっきりさせる

Time-varying exposureと聞くと、何やら物々しいですが・・・。 実は、ほぼ全ての介入はtime-varyingと言えます。 時間によって変化する暴露因子に対して、どういう研究モデルとなるのか、気になりませんか。 この記事で ...

続きを見る

 

 

疫学方法論

Regression, model概論

パラメトリックモデル、ノンパラメトリックモデルとは?

パラメトリックモデル、ノンパラ、あまり聞き慣れないかもしれません。 これは全然難しくないのですが、なんか解説みても難しく感じちゃう方、いるかと思います。多くの解説が難しそうに書いてあるから。 この記事では、パラメトリック/ノンパラメトリック ...

続きを見る

オッズ比とリスク比の違い、ロジスティック回帰の原理

オッズ比とリスク比。よく混同される違いで、大事です。 この違いはロジスティック回帰の原理とも関連します。 これを説明されているサイトを頻繁にみますが、この記事ではよりわかりやすく、プラクティカルに説明しました。   Content ...

続きを見る

Linear regressionについて徹底解説!【まとめ】

Linear regression(線形回帰)、一番基本的な統計モデルです。 統計ソフトで簡単に行えますが、この ・コンセプト ・前提(assumption) を理解しておくことは、実際に使う上で極めて重要です。 この記事では、これらをわか ...

続きを見る

多変量解析:どう正しく設計するか【調整因子の決め方】

「何の要素で調整するか。」研究でよくある話題です。 調整因子の決め方は、おそらく「単変量解析で有意なものを使う」が一番メジャーな方法なのではないでしょうか(特に臨床研究では)。 稀にBackward selectionなどを使った論文も見ま ...

続きを見る

COX比例ハザードモデルの実践的解説【数式(ほぼ)なし】

COX比例ハザードモデルって、ちょっと難しく感じる方もいるかもしれません。 ロジスティック回帰同様、統計ソフトで簡単にモデルできますが、論理背景がちょっと違います。 特に、Proportional hazardという仮定に基づいていることが ...

続きを見る

Proportional hazardが成り立たない時、どうする?【生存解析Tips】

Proportional hazardsというCOXモデルの前提は、ほとんどの場合成り立ちません。 でもそれ以外の良い手法がないから(知らないから)、皆COXを使っているのです。 多変量解析する方法は、本当にCOXしか無いのか?? そんなこ ...

続きを見る

 

傾向スコア

傾向スコアを使う前に知っておくべき事 TOP 5【重要】

傾向スコア、色んな所で多用されています。 わりと簡単にできるし、特に傾向スコアマッチングは見た目と使い勝手が良いです。 しかし、そもそも 「なぜ傾向スコアを使う(必要がある)か」 考えたことはあるでしょうか。 普通の多変量解析ではだめなので ...

続きを見る

 

IPW

IPW (inverse probability weighting)って何?【今後流行る】

IPW, inverse probability weighting。 因果推論においてかなり重要なコンセプトです。 今後、絶対流行ります。全然難しくないし。 この記事では、IPWの基本について解説します。数式なし。 Propensity ...

続きを見る

Lost follow-upによる選択バイアスをIPWで調整する

Lost follow-up。多くの臨床研究では単に除外されて済まされてしまっている問題です。 でも間違いなくselection biasにつながっており、この点疫学者はかなり厳しく見る傾向にあります。 「でもlost follow-upな ...

続きを見る

IPWのweightを「安定化」させる方法

IPW [inverse probability weighting]、おわかり頂けているでしょうか。 簡単なんです。 ただ、1/PSと計算されるため、weightが大きくなりすぎる時があります。 例えばPS=0.01だったら、その人は10 ...

続きを見る

 

Instrumental variable

Mendelian Randomizationについてわかりやすく解説!

Mendelian Randomization、最近論文で時々目にすることもあるかと思います。 でも実際どうやるのか、知っている方はほとんどいないのはないでしょうか。 それもそのはず、Mendelian Randomizationは比較的発 ...

続きを見る

 

感度分析

E-valueは超簡単な感度分析【誰でもできる】

E-valueって聞いたことありますか。 おそらく最も簡単かつ頻用されている、感度分析の方法です。 NEJMやLancetに載る一流の研究でも用いられています。 このE-valueの方法と解釈について、わかりやすく解説していきます。 &nb ...

続きを見る

 

発展的手法

【完全版】中間因子解析の徹底解説!

この記事では、中間因子解析=mediation analysisを徹底解説します! 実に単純なものから、counterfactualを考えた複雑なものまで。完全網羅しました。 この記事さえ読めば、mediation analysisに関して ...

続きを見る

Regression Discontinuity Designのポイント【数式なし】

Regression discontinuity design (RDD),日本語では「回帰不連続デザイン」。 臨床研究ではそこまで普及してませんが、因果推論の手法としてはメジャーです。 知らないと何やってんだか意味不明ですが、知ってると、 ...

続きを見る

G-estimationのコンセプトを簡単に理解する

G-estimationって聞いたことありますか? 因果推論の手法なのですが、おそらく知らない方がほとんどだと思います。 それで問題ないし、使いこなすのはとても難しい概念です。 IPWと並ぶ、time-varying confounder/ ...

続きを見る

Putative placebo analysisの注意点

最近流行りのPutative placebo analysis。 簡単に言うと、「A vs. B」と「B vs. C」の結果を基に、「A vs. C」の結果を言及する、というものです。 単純に積をとるだけ。 この記事では、そんなputati ...

続きを見る

 

 

研究デザイン

研究デザイン基礎

暴露因子を決める時に気をつけること【well-defined intervention/exposure】

臨床研究・疫学研究において最も重要なことは、暴露因子とアウトカムを定めることにあるといっても過言ではありません。その組み合わせの因果関係を言うことが、ほとんどの研究の主題です。この記事では、コホート研究において暴露因子を決める際に気をつけること、well-defined exposure/interventionについて解説します。

続きを見る

前向き研究と後ろ向き研究の違い、はっきり区別してますか?【意味を理解する】

この記事では、ハーバードで定義している「前向き研究」「後ろ向き研究」を紹介します。この記事を読めば、例えば誰かに「それは後ろ向きだ!」と突っ込まれても、「研究デザインは前向きです」と自信を持って答えられるようになります。

続きを見る

 

ランダム化試験

ランダム化試験 vs. 観察研究【完全解説】

ビッグデータの時代。解析方法も発展した。 データをたくさん使った観察研究なら、色々言える気がします。 お金も手間も時間もかかる、ランダム化試験ってやる意味あるんでしょうか。 また、観察研究とランダム化試験ではどれくらい結論に差がでるものなの ...

続きを見る

スクリーニングのRCTで注意すべきバイアス3選

スクリーニングをした方がよいか、しない方がよいか。 巷では「スクリーニングを受けると死ぬ」と言ってる人もいるとかいないとか。 この答えを出すのが大規模ランダム化試験ですが、実はその解釈に注意すべきポイントがいくつもあります。 その中でも特に ...

続きを見る

【論破】Intention-to-treat analysisは微妙だよ、という話

ランダム化試験で必ず報告されるIntention-to-treat (ITT) effect。 ただ相関を取るだけ。何も考えずに計算できる代物です。 が、微妙な点がいくつも。 この記事では、ITT信奉者を様々な角度から論破してみました。 & ...

続きを見る

 

症例対照研究

症例対照研究ってどうやるの?【わかりやすく解説】

症例対照研究(ケースコントロール研究)って分かりづらいですよね。 実際やったことがあると感覚がわかるのですが、なかなか経験ある方はいないと思います。 この記事では、症例対照研究とは何か?具体的にどうやるか? わかりやすく、実践的に解説しまし ...

続きを見る

症例対照研究の基本は「Density-sampling」である

症例対照研究、疫学研究者でなければ自分で行うことはほとんどないと思いますが、論文では度々見かけます。 Case-control studyという文字を見ただけで、少し身構えてしまう方、多いのではないでしょうか。 この記事では、case-co ...

続きを見る

マッチングした症例対照研究で、マッチした要素で調整する必要がある理由

ほとんどの症例対照研究では、年齢や性別などのマッチングが行われます。 意外に知られていないのは、メインの解析ではそのマッチした要素で調整しないと、バイアスのかかった結果となってしまうということ。 何故なのでしょうか? そもそもマッチングの意 ...

続きを見る

ケース・コホート研究の簡単解説!

コホート研究とケースコントロール研究はわかる。 ケース・コホート研究?なんだそれ?? そんな方のため。 この記事ではcase-cohort研究とは何か、何故良いか、何に気をつけるべきか、非常に簡単に解説しました。     ...

続きを見る

 

メタ解析

メタアナリシスの手法をわかりやすく解説【ほぼ数式なし】:weight, fixed/random effect, heterogeneityなど

メタアナリシス(メタ解析)の解析手法はやや特殊でわかりにくいと思います。 系統的に習ったことなければ、forest plotを見るのにも抵抗感があるかと思います。 そんな方のため! この記事では、メタアナリシスの手法の根幹であるfixed ...

続きを見る

 

 

統計いろいろ

正しい英語を!

統計用語(英語)を正しく使おう:efficient, validなど

英単語、ちょっと曖昧に使ってたりしませんか? 論文書くとき、同じ単語を避けるため、efficientlyやvalidlyとかaccuratelyとか、使いまわしてないですか? だめです。本当は。 論文でやっていることは統計的な解析のはずなの ...

続きを見る

bootstrap

Bootstrap法について簡単解説【実践的】

今やBootstrap法知らずして、ちょっと手の混んだ研究を行うことは難しいです。 というかこれが簡単に行えるおかげで、複雑な解析の95%信頼区間やp値を簡単に出すことができる、といえます。 この記事では、Bootstrap法の基本的+実用 ...

続きを見る

MLE

Maximum Likelihood Estimationについておさらい!

MLE、統計モデルではしょっちゅう出てきます。 この理論的背景を知ることで、統計ソフトが何やっているのか、わかります。 この記事の対象は、研究で「モデルを作ってただ結果を見る」レベルから一歩踏み出したい方。 とても大事な基礎です。 &nbs ...

続きを見る

Over-fitting

過学習(Overfitting)とその対策【数式なしで解説】

過学習(overfitting)とは何か、なぜ生じるか、その結果どうなるか。 対策法は何か。 これを「数式なし」で解説してみました。 よく言われる 「過学習を避けるため、ロジスティック回帰に入れられる因子はアウトカムの個数÷10まで」 など ...

続きを見る

Multiple testing

多重比較:実践的な対処法【multiple testing】

多重比較(multiple testing)は、統計検定を繰り返し行う際の問題です。 結論が変わりうるのでかなり注意すべき事項ですが、特に臨床研究では残念ながらそうとも限りません。 この記事では、多重比較についてわかりやすく解説し、対応方法 ...

続きを見る

 

 

-疫学・臨床研究

Copyright© Riklog , 2021 All Rights Reserved Powered by AFFINGER5.