-
-
Linear regressionについて徹底解説!【まとめ】
2020/9/18
Linear regression(線形回帰)、一番基本的な統計モデルです。 統計ソフトで簡単に行えますが、この ・コンセプト ・前提(assumption) を理解しておくことは、実際に使う上で極めて重要です。 この記事では、これらをわかりやすく説明しました。 *よく教科書で出てくる ...
-
-
「うんこかどうか」から疫学は始まった。
2020/9/17
今回は衝撃的な歴史の話です。 「うんこ」論争。 これを期に、疫学が発展しました。 うんこが感染症の原因なのか・・・。 臨床研究や疫学に取り組む方は特に、この「うんこ」論争、絶対に知っておきましょう。 「うんこかどうか」から疫学は始まった。 冗談でない、本当の話です。 この ...
-
-
External validationの方法いろいろ【まとめ】
2020/9/15
予測モデルのvalidationというのは、そのデータ内で行うもの(internal validation)だけではありません。 むしろ、そのデータ外でどの程度通用するかというのが一番大事です。 これは予測モデルの「test」の話ですが、疫学的な側面もあります。 この記事では、external va ...
-
-
Internal validationの種類について解説【まとめ】
2020/9/14
予測モデルのvalidationには種類があります。 よく行われるのはdata splittingや10-fold cross-validationかと思います。 でもそれらには特有のlimitationがあり、使うべき手法は、実は決まっています。 この記事では、色々あるinternal valid ...
-
-
Time-varying exposureの因果推論での目的をはっきりさせる
2020/9/13
Time-varying exposureと聞くと、何やら物々しいですが・・・。 実は、ほぼ全ての介入はtime-varyingと言えます。 時間によって変化する暴露因子に対して、どういう研究モデルとなるのか、気になりませんか。 この記事では、time-varying exposureというものをは ...
-
-
Maximum Likelihood Estimationについておさらい!
2020/9/12
MLE、統計モデルではしょっちゅう出てきます。 この理論的背景を知ることで、統計ソフトが何やっているのか、わかります。 この記事の対象は、研究で「モデルを作ってただ結果を見る」レベルから一歩踏み出したい方。 とても大事な基礎です。 Maximum Likelihood E ...
-
-
Misclassificationのあるリスク比を調整する【高校数学レベル】
2020/9/11
測定誤差があったとき、そしてvalidation studyの情報が利用可能なとき、実際にはどう計算したらよいのか。 R等ではパッケージで自動的に計算できますが、その論理背景を理解すれば、簡単に応用が効きます。 この記事では、misclassificationがある場合のリスク比の算出方法を、高校数 ...
-
-
Misclassificationの調整法を知ろう【中学数学レベル】
2020/9/9
カテゴリー変数の情報が、誤っている可能性があるとき。 Misclassificationと言います。当然これがあると、正確な関連性を知ることができません。 このmisclassification、validation studyを使って調整する方法があります。 調整法は超簡単。中学数学レベルです。 ...
-
-
Overfitting(過学習)についてしっかり理解しよう【数式なし】
2020/9/8
臨床研究をやってまず注意されることがoverfitting。 「Overfitを避けるため、ロジスティック回帰に入れられる因子はアウトカムの個数÷10まで」とか教えられます。 しかしそもそもOverfittingとは何か、学ぶ機会はほとんどありません。 そして、なぜoverfittingが生じるか、 ...
-
-
昔の人はどうやって健康を追求していたか
2020/9/7
エビデンス、科学的根拠により健康を考えるようになったのは、つい最近のことです。 疫学という学問が発展したのは19世紀から。 それより昔の人はどうしていたのか? 誰しも「健康であること」には多大な関心があるものです。 この記事では、そんな歴史を少し振り返り、今の医学や疫学との関連性を考えてみます。 & ...