ベイズの定理とは?
この記事では,コロナ禍で普及したPCR検査を例に,統計学において最も有名な定理の一つであるベイズの定理の重要性について説明したいと思います.
ベイズの定理は, 式 1 のように表すことができます.
\[ P(A|B) \propto P(B|A) P(A) \tag{1}\]
式 1 は,以下のことを示しています.
- ある結果\(B\)が生じた場合に,それが原因\(A\)によるものである確率\(P(A|B)\)は
- ある原因\(A\)の生じる確率\(P(A)\)とある原因\(A\)のもとで結果\(B\)が生じる確率\(P(B|A)\)の掛け算に比例(\(\propto\))する
もっと身近なもので例えてみましょう. たとえば,
- 原因\(A\):新型コロナへの感染の有無
- 結果\(B\):PCR検査などでの診断結果
と考えれば, 式 1 を 式 2 のように置き換えることができます.
\[ P(感染の有無|診断結果) \propto P(診断結果|感染の有無) P(感染の有無) \tag{2}\]
なぜベイズの定理が重要なのか?
式 2 に基づき,ベイズの定理の重要性について考えてみましょう. 実は, 式 2 に示したベイズの定理に出てくる3つの確率は,どれも非常に重要な指標と対応しています(下表参照). つまり, 式 2 からは,検査の精度(感度・特異度)が高くても,検査前確率が低ければ陽性的中率が低くなることなどがわかります.
確率 | 医療分野で対応する指標 |
---|---|
\(P(診断結果|感染の有無)\) | 検査後確率:統計学では事後確率と呼ばれる
|
\(P(診断結果|感染の有無)\) |
|
\(P(感染の有無)\) | 検査前確率:統計学では事前確率と呼ばれる
|
たとえば,以下のような状況を考えてみましょう.
- 感度・特異度はともに99 %(偽陰性・偽陽性がいずれも1 %の確率で生じる)
- 検査前確率は1 %(感染者は100 人中1 人で残りの99 人は未感染者)
この場合,陽性と診断された場合に感染者である確率\(P(感染|陽性)\)と,陽性と診断された場合に未感染者である確率\(P(未感染|陽性)\)は, それぞれ 式 3 となります.
\[ \begin{align} P(感染|陽性) \propto P(陽性|感染)P(感染) &= 0.99 \times 0.01 = 0.0099 \\ P(未感染|陽性) \propto P(陽性|未感染)P(未感染) &= (1 - 0.99) \times (1 - 0.01) = 0.0099 \end{align} \tag{3}\]
式 3 より,\(P(感染|陽性)\)と\(P(未感染|陽性)\)は等しいことがわかり, 陽性的中率は50 %となります. つまり,陽性と診断された検査対象者のなかで,実際に,感染者である人は2人に1人しかいないことがわかります.
このように,ベイズの定理を用いることで 「検査の精度(感度・特異度)が高くても検査前確率が低ければ陽性的中率が低くなってしまう」といった 重要な関係性が明らかとなります.
まとめ
コロナ禍で普及したPCR検査を例に,ベイズの定理の重要性について説明しました.
現実に即した計算事例に興味がある場合は, 統計局の公開しているコラムもご一読されることをおすすめします.