統計学

条件つき確率とベイズの定理

学習者

ベイズの定理は勉強したことがありますが、その価値はなんなのかと問われるとうまく説明できません。。。
ベイズの定理の価値はどういったものでしょうか?

すたどく

『事象$A$が生じた下で事象$B$が生じる確率』が既知である時に、
逆に、
『事象$B$が生じた下で事象$A$が生じる確率』を求めることができます*!

*:ただし、必要となる追加情報がいくつかあります(後述)。

1. 条件つき確率

(定義)
『事象$B$が生じた下で事象$A$が生じる確率(条件つき確率)$Pr\{ A|B \}$』は、 $$ \begin{aligned} \boldsymbol{Pr\{ A|B \} = \frac{Pr\{ A \cap B \}}{Pr\{ B \}}} \end{aligned} $$と定義されます。

すたどく

基本の内容ですが、次のベイズの定理に直接関わってくるので、再確認しておいてください。

2. ベイズの定理

(定理)
事象$A, B_i(i=1, \ldots, k)$に対して、$$ \begin{aligned} B_i ~ \cap ~ B_j &= \varnothing ~~ \small{(ただしi \neq j)} ~~~~~\bold{\mathrm{(A)}} \\ \bigcup_{i=1}^k B_i &= \Omega ~~ \small{(標本空間)} ~~~~~\bold{\mathrm{(B)}} \end{aligned}$$ である時、$$\begin{aligned} Pr\{ B_i|A \} &= \frac{Pr\{ A \cap B_i \}}{Pr\{ A \}} \\[10px] &= \frac{Pr\{ A|B_i \} \cdot Pr\{ B_i \}}{Pr\{ A \}} ~~~~~\bold{\mathrm{(C)}} \\[10px] &= \frac{Pr\{ A|B_i \} \cdot Pr\{ B_i \}}{\sum_{j=1}^k \left\{ Pr\{ A|B_j \} \cdot Pr\{ B_j \} \right\}} ~~~~~\bold{\mathrm{(D)}}\end{aligned}$$ となります。

  • 証明は条件つき確率をくり返すだけなので省略しました。

  • $\mathrm{(A)}$は「$B_i$と$B_j$の積集合がない」ことを表し、$\mathrm{(B)}$は「$B_1, \ldots, B_k$の和集合が標本空間全体である」ことを表します。

  • ベイズの定理の中身を確認すると、$Pr\{ A|B_i \}$が既知であれば(ある意味逆の関係にある)$Pr\{ B_i|A \}$を求めることができることがわかります。

    ただし、$Pr\{ B_i \}, Pr\{ A \}$も既知である必要があります。($\mathrm{(C)}$より)

    もしくは$Pr\{ A \}$が既知でなくとも、$Pr\{ A|B_j \}, Pr\{ B_j \}(j=1, \ldots, k)$が既知であれば構わないことがわかります。($\mathrm{(D)}$より)
すたどく

$\mathrm{(C), (D)}$ともによく使われる式なので、どちらも一瞬で書き下せるようにしておきましょう!

例題1.
ある国で新規ウイルス感染症が確認され、有病割合(病気をもつ人の割合)が$1$%と推定されている。 この新規ウイルス感染症に対する検査キットAの感度(病気をもつ人の中で検査陽性となる割合)、特異度(病気をもたない人の中で検査陰性となる割合)はそれぞれ$90$%, $80$%であるとする。 この時、以下の問いについて小数第3位まで求めよ。

(1). Cさんが検査キットAを受けたところ、『陰性』であった。 この時、Cさんが病気をもたない(検査が正しい)確率を求めよ。

(2). Dさんが検査キットAを受けたところ、『陽性』であった。 この時、Dさんが病気をもつ(検査が正しい)確率を求めよ。

その後、検査キットAの感度が疑わしいことが発覚し、急遽検査キットBを組み合わせることになった。 検査キットAで『陽性』となった人を対象として、この新規ウイルス感染症に対する検査キットBの感度、特異度はそれぞれ$95$%, $90$%であるとする*。 (*:ある検査キットの感度・特異度を調べる時に、別の検査キットで『陽性』となった人を対象として調べることは通常ないが、ここでは問題作成のため仮想的にそのようにした)

(3). Dさんは(2)に続いて検査キットBを受けたところ、『陽性』であった。 この時、Dさんが病気をもつ(検査が正しい)確率を求めよ。

解答.
事象$A, A^c, B, B^c, Pos$を以下のように定める。

・$A$:検査キットAで『陽性』
・$A^c$:検査キットAで『陰性』
・$B$:検査キットBで『陽性』
・$B^c$:検査キットBで『陰性』
・$Pos$:この新規ウイルス感染症をもつ
・$Pos^c$:この新規ウイルス感染症をもたない

すると、以下の様になる。

・$Pr\{ Pos \} = 0.01$
・$Pr\{ Pos^c \} = 0.99$
・$Pr\{ A|Pos \}= 0.9$
・$Pr\{ A^c|Pos^c \} = 0.8$
・$Pr\{ B|Pos, A \} = 0.95$
・$Pr\{ B^c|Pos^c, A \} = 0.9$

(1). 求める確率は$Pr\{ Pos^c|A^c \}$であり、$$ \begin{aligned} Pr\{ Pos^c|A^c \} &= \frac{Pr\{ Pos^c \cap A^c \}}{Pr\{ A^c \}} \\ &\scriptsize{(条件つき確率の定義より)} \\[10px] &= \frac{Pr\{ A^c|Pos^c \} \cdot Pr\{ Pos^c \}}{Pr\{ A^c|Pos \} \cdot Pr\{ Pos \} + Pr\{ A^c|Pos^c \} \cdot Pr\{ Pos^c \}} \\ &\scriptsize{(ベイズの定理より)} \\[10px] &= \frac{Pr\{ A^c|Pos^c \} \cdot Pr\{ Pos^c \}}{\{1 – Pr\{ A|Pos \}\} \cdot Pr\{ Pos \} + Pr\{ A^c|Pos^c \} \cdot Pr\{ Pos^c \}} ~~~~~\bold{\mathrm{(E)}} \\[10px] &= \frac{0.8 \cdot 0.99}{(1 – 0.9) \cdot 0.01 + 0.8 \cdot 0.99} \\[10px] &= 0.9987\cdots \\[10px] &\fallingdotseq 0.999 \end{aligned}$$

(2). 求める確率は$Pr\{ Pos|A \}$であり、$$ \begin{aligned} Pr\{ Pos|A \} &= \frac{Pr\{ Pos \cap A \}}{Pr\{ A \}} \\ &\scriptsize{(条件つき確率の定義より)} \\[10px] &= \frac{Pr\{ A|Pos \} \cdot Pr\{ Pos \}}{Pr\{ A|Pos \} \cdot Pr\{ Pos \} + Pr\{ A|Pos^c \} \cdot Pr\{ Pos^c \}} \\ &\scriptsize{(ベイズの定理より)} \\[10px] &= \frac{Pr\{ A|Pos \} \cdot Pr\{ Pos \}}{Pr\{ A|Pos \} \cdot Pr\{ Pos \} + \{1 – Pr\{ A^c|Pos^c \}\} \cdot Pr\{ Pos^c \}} ~~~~~\bold{\mathrm{(F)}} \\[10px] &= \frac{0.9 \cdot 0.01}{0.9 \cdot 0.01 + (1 – 0.8) \cdot 0.99} \\[10px] &= 0.0434\cdots \\[10px] &\fallingdotseq 0.043 \end{aligned}$$

(3). 求める確率は$Pr\{ Pos|B, A \}$であり、$$ \begin{aligned} Pr\{ Pos|B, A \} &= \frac{Pr\{ Pos \cap B|A \}}{Pr\{ B|A \}} ~~~~~\bold{\mathrm{(G)}} \\[10px] &= \frac{Pr\{ B|Pos, A \} \cdot Pr\{ Pos|A \}} {Pr\{ B|Pos, A \} \cdot Pr\{ Pos|A \} + Pr\{ B|Pos^c, A \} \cdot Pr\{ Pos^c|A \}} \\[10px] &= \frac{Pr\{ B|Pos, A \} \cdot Pr\{ Pos|A \}} {Pr\{ B|Pos, A \} \cdot Pr\{ Pos|A \} + \{1 – Pr\{ B^c|Pos^c, A \}\} \cdot \{1 – Pr\{ Pos|A \}\}} \\[10px] &= \frac{0.95 \cdot 0.043}{0.95 \cdot 0.043 + (1 – 0.9) \cdot (1 – 0.043)} \\ &\scriptsize{((2)の結果を利用)}\\[10px] &= 0.2991\cdots \\[10px] &\fallingdotseq 0.299 \end{aligned}$$

  • $\mathrm{(E)}$を参照すると、 $$\begin{aligned} {\small (求める確率)} = \frac{\blacksquare}{{\small (1 – 感度) \cdot 有病割合} + \blacksquare} \end{aligned}$$ という形になっているので、感度が1に近い場合や有病割合が0に近い場合には${\small (求める確率)} \fallingdotseq 1$、となります。

  • $\mathrm{(F)}$を参照すると、 $$\begin{aligned} {\small (求める確率)} = \frac{\blacksquare}{\blacksquare + { \small (1 – 特異度) \cdot (1 – 有病割合)}} \end{aligned} $$という形になっているので、特異度が1に近い場合や有病割合が1に近い場合には${\small (求める確率)} \fallingdotseq 1$、となります。

  • $\mathrm{(G)}$の等式にとまどうかもしれません。 しかし、これは”$|A$”がついているだけのことです。混乱した場合には、一度”$|A$”を外して書き直してみると(1)(2)と同じパターンであることがわかると思います。

まとめ.

  • (いくつかの追加情報がある下で)ベイズの定理を用いることで、 $Pr\{ A|B_i \}$から$Pr\{ B_i|A \}$を求めることができる。

他の記事を参照されたい方はこちら

 サイトマップからお好きな記事をお探しください。