$\gdef \vec#1{\boldsymbol{#1}} \\ \gdef \rank {\mathrm{rank}} \\ \gdef \det {\mathrm{det}} \\ \gdef \Bern {\mathrm{Bern}} \\ \gdef \Bin {\mathrm{Bin}} \\ \gdef \Mn {\mathrm{Mn}} \\ \gdef \Cov {\mathrm{Cov}} \\ \gdef \Po {\mathrm{Po}} \\ \gdef \HG {\mathrm{HG}} \\ \gdef \Geo {\mathrm{Geo}}\\ \gdef \N {\mathrm{N}} \\ \gdef \LN {\mathrm{LN}} \\ \gdef \U {\mathrm{U}} \\ \gdef \t {\mathrm{t}} \\ \gdef \F {\mathrm{F}} \\ \gdef \Exp {\mathrm{Exp}} \\ \gdef \Ga {\mathrm{Ga}} \\ \gdef \Be {\mathrm{Be}} \\ \gdef \NB {\mathrm{NB}} \\ \gdef \indep {\mathop{\perp\!\!\!\!\perp}} \\ \gdef \tr {\mathrm{tr}}$
今回は分割表の検定として「フィッシャーの正確検定」を扱います。
<分割表における検定>で$\chi^2$検定、尤度比検定を扱いましたが、これらとフィッシャーの正確検定の違いは何でしょうか?
$\chi^2$検定、尤度比検定においては「$\overset{\displaystyle {d}}\longrightarrow$」が出現しており、これらは漸近分布に基づく検定でした。一方で、フィッシャーの正確検定は漸近分布を使用しません。
0. 前提
フィッシャーの正確検定では2つのカテゴリーをもつ変数$A,B$の独立性を調べるための検定であり、相手にするのは以下の様な2×2分割表となります。
$B_1$ | $B_2$ | 合計 | |
$A_1$ | $X_{11}$ | $X_{12}$ | $x_{1 \bullet}$ |
$A_2$ | $X_{21}$ | $X_{22}$ | $x_{2 \bullet}$ |
合計 | $x_{\bullet 1}$ | $x_{\bullet 2}$ | $x_{\bullet \bullet}$ |
関係性を調べるためにはサンプリングしてくる必要がありますが、サンプリングする際には<分割表の統計モデル>で紹介した通り、
①どこもfixされない場合
②総和がfixされる場合
③列和または行和がfixされる場合
の3通りの形式があります。
各場合における統計モデルの置き方は<分割表の統計モデル>で扱った通りですが、ここで復習しておきます。
⚫️①どこもfixされない場合
各セルの度数$X_{ij} ~~ \small{(i=1,2;j=1,2)}$はポアソン分布$\Po(\theta_{ij})$に従うというモデルを想定することができ、明示すると、
$$\begin{aligned} X_{11} &\sim \Po(\theta_{11}) \\ X_{12} &\sim \Po(\theta_{12}) \\ X_{21} &\sim \Po(\theta_{21}) \\ X_{22} &\sim \Po(\theta_{22}) \end{aligned}$$となります。
また同時確率関数$p(x)$は、
$$\begin{aligned} p(x) &= \prod_{i,j} e^{-\theta_{ij}} \frac{\theta_{ij}^{x_{ij}}}{x_{ij}!} \\ &= (e^{-\theta_{11}} \frac{\theta_{11}^{x_{11}}}{x_{11}!}) \cdot (e^{-\theta_{12}} \frac{\theta_{12}^{x_{12}}}{x_{12}!}) \cdot (e^{-\theta_{21}} \frac{\theta_{21}^{x_{21}}}{x_{21}!}) \cdot (e^{-\theta_{22}} \frac{\theta_{22}^{x_{22}}}{x_{22}!}) \end{aligned}$$となります。
⚫️②総和がfixされる場合
各セルの度数$X_{ij} ~~ \small{(i=1,2;j=1,2)}$は4項分布に従うというモデルを想定することができ、明示すると、
$$\begin{aligned} (X_{11},X_{12},X_{21},X_{22}) &\sim \Mn(x_{\bullet \bullet};p_{11},p_{12},p_{21},p_{22}) \\ (&= \Mn(x_{\bullet \bullet};p_{11},p_{12},p_{21},1-p_{11}-p_{12}-p_{21}) ) \end{aligned}$$となります。
また同時確率関数$p(x)$は、
$$\begin{aligned} p(x) &= \frac{x_{\bullet \bullet}!}{\prod_{i,j} x_{ij}!} \prod_{i,j} p_{ij}^{x_{ij}} \\ &= \frac{x_{\bullet \bullet}!}{x_{11}! x_{12}! x_{21}! x_{22}!} p_{11}^{x_{11}} p_{12}^{x_{12}} p_{21}^{x_{21}} p_{22}^{x_{22}} \\ &= \frac{x_{\bullet \bullet}!}{x_{11}! x_{12}! x_{21}! x_{22}!} p_{11}^{x_{11}} p_{12}^{x_{12}} p_{21}^{x_{21}} (1-p_{11}-p_{12}-p_{21})^{(x_{\bullet \bullet}-x_{11}-x_{12}-x_{21})} \end{aligned}$$となります。
⚫️③列和または行和がfixされる場合
(ここでは列和がfixされる場合を扱いますが、行和がfixされる場合も同様です)
列和がfixされる場合、各セルの度数$X_{ij} ~~ \small{(i=1,2;j=1,2)}$は$2$項分布$(\times 2)$に従うというモデルを想定することができ、明示すると、
$$\begin{aligned} X_{11} &\sim \Bin(x_{\bullet 1},p_{11}) \\ X_{12} &\sim \Bin(x_{\bullet 2},p_{12}) \\ (X_{21}&=x_{\bullet 1}-X_{11}) \\ (X_{22}&=x_{\bullet 2}-X_{12}) \end{aligned}$$
また同時確率関数$p(x)$は、
$$\begin{aligned} p(x) &= \prod_{j} \{ \frac{x_{\bullet j}!}{\prod_i x_{ij}!} \prod_i p_{ij}^{x_{ij}} \} \\ &= \prod_{j} \{ \frac{x_{\bullet j}!}{x_{1 j}! x_{2 j}!} p_{1 j}^{x_{1 j}} p_{2 j}^{x_{2 j}} \} \\ &= \{ \frac{x_{\bullet 1}!}{x_{1 1}! x_{2 1}!} p_{1 1}^{x_{1 1}} p_{2 1}^{x_{2 1}} \} \{ \frac{x_{\bullet 2}!}{x_{1 2}! x_{2 2}!} p_{1 2}^{x_{1 2}} p_{2 2}^{x_{2 2}} \} \\ &= \{ \frac{x_{\bullet 1}!}{x_{1 1}! x_{2 1}!} p_{1 1}^{x_{1 1}} (1-p_{1 1})^{(x_{\bullet 1}-x_{1 1})} \} \{ \frac{x_{\bullet 2}!}{x_{1 2}! x_{2 2}!} p_{1 2}^{x_{1 2}} (1-p_{1 2})^{(x_{\bullet 2}-x_{1 2})} \} \end{aligned}$$となります。
(注意)
②の場合には、
$$\begin{aligned} p_{11} + p_{12} + p_{21} + p_{22} = 1 \end{aligned}$$ですが、 ③の場合には、
$$\begin{aligned} p_{11} + p_{21} &= 1 \\ p_{12} + p_{22} &= 1 \end{aligned}$$となってるので注意してください。
1. フィッシャーの正確検定
上記の各場合における独立性の帰無仮説の置き方は<分割表の統計モデル>で扱った通りですが、実は全ての場合における帰無仮説は、分布パラメータのオッズ比$\psi$を、
$$\begin{aligned} \psi &= \frac{\frac{p_{11}}{p_{12}}}{\frac{p_{21}}{p_{22}}} \\ &= \frac{p_{11} p_{22}}{p_{12} p_{21}} \end{aligned}$$とおいた時、
$$\begin{aligned} \begin{cases} {\small 帰無仮説} H_0: \psi = 1 \end{cases} \end{aligned}$$という帰無仮説と同等となります。
(詳細は割愛します。なお②③の方が①よりも扱われる頻度が高いため、分布パラメータは$\theta_{ij}$ではなく$p_{ij}$を採用しました。)
対立仮説の置き方は、両側検定であれば、
$$\begin{aligned} \begin{cases} {\small 対立仮説} H_1: \psi \neq 1 \end{cases} \end{aligned}$$となり、片側検定であれば、
$$\begin{aligned} \begin{cases} {\small 対立仮説} H_1: \psi \gt 1 \end{cases} \end{aligned}$$となります。
(ただし、オリジナルのフィッシャーの正確検定では片側検定のみを想定していた様です)
フィッシャーの正確検定では帰無仮説$H_0$の下で、分割表の行和・列和をfixした下での条件付き分布に基づいて検定をします。
これがフィッシャーの正確検定の肝です。
2. 具体的な検定方法
サンプリングの過程は『0. 前提』のいずれの場合でも構いません。
2×2分割表における各セルの値(確率変数)を$X_{11}, X_{12}, X_{21}, X_{22}$とします。
$B_1$ | $B_2$ | 合計 | |
$A_1$ | $X_{11}$ | $X_{12}$ | $x_{1 \bullet}$ |
$A_2$ | $X_{21}$ | $X_{22}$ | $x_{2 \bullet}$ |
合計 | $x_{\bullet 1}$ | $x_{\bullet 2}$ | $x_{\bullet \bullet}$ |
行和$x_{1 \bullet}, x_{2 \bullet}$、列和$x_{\bullet 1}, x_{\bullet 2}$をfixした上で$(X_{11}, X_{12}, X_{21}, X_{22}) = (x_{11}, x_{12}, x_{21}, x_{22})$となる確率$Pr\{ (X_{11}, X_{12}, X_{21}, X_{22}) = (x_{11}, x_{12}, x_{21}, x_{22}) | X_{11}+X_{12} = x_{1 \bullet}, X_{21} + X_{22} = x_{2 \bullet}, X_{11} + X_{21} = x_{\bullet 1}, X_{12} + X_{22} = x_{\bullet 2} \}$(長いので以下、$Pr\{ (X_{11}, X_{12}, X_{21}, X_{22}) = (x_{11}, x_{12}, x_{21}, x_{22}) | x_{1 \bullet}, x_{2 \bullet}, x_{\bullet 1}, x_{\bullet 2} \}$と書きます)は、サンプリングの過程は『0. 前提』のいずれの場合でも、超幾何分布の確率関数の形になります。
(導出に興味がある方は<補足. フィッシャーの正確検定_確率の導出>を参照ください)
この事実は重要なので覚えてしまってください。
つまり、
$$\begin{aligned} Pr\{ (X_{11}, X_{12}, X_{21}, X_{22}) = (x_{11}, x_{12}, x_{21}, x_{22}) | x_{1 \bullet}, x_{2 \bullet}, x_{\bullet 1}, x_{\bullet 2} \} &= Pr\{ X_{11} = x_{11} | x_{1 \bullet}, x_{2 \bullet}, x_{\bullet 1}, x_{\bullet 2} \} \\ &{\scriptsize(X_{11}のみ決まれば残りは決まるため)} \\ &= \frac{ \displaystyle \binom{ x_{\bullet 1} }{ x_{11} } \displaystyle \binom{ x_{\bullet 2} }{ x_{12} } }{ \displaystyle \binom{ x_{\bullet \bullet} }{ x_{1 \bullet} } } (= \frac{ \displaystyle \binom{ x_{1 \bullet} }{ x_{11} } \displaystyle \binom{ x_{2 \bullet} }{ x_{21} } }{ \displaystyle \binom{ x_{\bullet \bullet} }{ x_{\bullet 1} } } ) \\ &= \frac{x_{\bullet 1}! x_{2 \bullet}! x_{1 \bullet}! x_{2 \bullet}! }{ x_{\bullet \bullet}! } \cdot \frac{1}{ x_{11}! x_{12}! x_{21}! x_{22}! } \end{aligned}$$
(ただし、$\max\{ 0, x_{\bullet 1}-(x_{\bullet \bullet}-x_{1 \bullet}) \} \leqq x_{11} \leqq \min\{x_{1 \bullet}, x_{\bullet 1} \}$)
となります。
p-valueとは、観測された事象よりも起こりにくい事象が帰無仮説$H_0$の下で起こる確率であることから、
$$\begin{aligned} \mathrm{p-value} &= Pr\{ X_{11} \geqq x_{11} | x_{1 \bullet}, x_{2 \bullet}, x_{\bullet 1}, x_{\bullet 2} \} \\ &= \sum_{k \geqq x_{11}} Pr\{ X_{11} = k | x_{1 \bullet}, x_{2 \bullet}, x_{\bullet 1}, x_{\bullet 2} \} \end{aligned}$$となります。
事前に定めた有意水準を$\alpha$とすると、
⚫️$\mathrm{p-value} \gt \alpha \Rightarrow$帰無仮説$H_0$を選択
⚫️$\mathrm{p-value} \leqq \alpha \Rightarrow$対立仮説$H_1$を選択
という判定がなされます。
(補足)
- 漸近分布に基づく分割表の検定の場合にはある程度のサンプルサイズが求められますが、フィッシャーの正確検定ではサンプルサイズが小さくても構いません。
- フィッシャーの正確検定は条件づけした下での検定ですが、条件づけしてない一般の場合の検定として機能します。
例題1.
あるウイルス疾患に対する治療薬Aと対照薬Bの効果を比較したい。 合計20人に対して以下の様なデータが得られたとする。
効果あり | 効果なし | 合計 | |
治療薬A | 8 | 2 | 10 |
対照薬B | 6 | 4 | 10 |
合計 | 14 | 6 | 20 |
帰無仮説$H_0$、対立仮説$H_1$を、
⚫️$H_0$:治療薬Aと対照薬Bの効果は同等
⚫️$H_1$:治療薬Aは対照薬Bよりも効果的
とした時、フィッシャーの正確検定により有意水準$\alpha=0.05$で検定せよ。
解答.
(治療薬A, 効果あり), (治療薬A, 効果なし), (対照薬B, 効果あり), (対照薬B, 効果なし)の度数をそれぞれ$X_{11}, X_{12}, X_{21}, X_{22}$とする。
すると、観測された事象よりも起こりにくい事象が起こる確率であるp-valueは、
$$\begin{aligned} \mathrm{p-value} &= Pr\{ X_{11} \geqq 8 | X_{11}+X_{12}=10,X_{21}+X_{22}=10, X_{11}+X_{21}=14, X_{12}+X_{22}=6 \} \\[10px] &= \sum_{x=8}^{10} Pr\{ X_{11} = x | X_{11}+X_{12}=10,X_{21}+X_{22}=10, X_{11}+X_{21}=14, X_{12}+X_{22}=6 \} \\[10px] &= \sum_{x=8}^{10} \frac{ \displaystyle \binom{14 }{ x } \displaystyle \binom{ 6 }{ 10-x } }{ \displaystyle \binom{ 20 }{ 10 }} \\[10px] &= 0.314\cdots \gt 0.05 \end{aligned}$$
したがって、帰無仮説$H_0$が選択される。
今回は対立仮説の定め方から片側検定となるためp-valueは上記の通りですが、もしも対立仮説が『治療薬Aと対照薬Bの効果は同等ではない』となれば両側検定となるため、$X_{11}$が小さい方向により起こりにくい確率の総和を$0.314$に足したものがp-valueとなります。ただし、両側検定のp-valueは片側検定のp-valueの2倍を取るという流派もある様で、統計ソフトによってもその求め方は異なる様です。
まとめ.
- フィッシャーの正確検定は$2 \times 2$分割表を相手にした検定であり、行和・列和をfixしたものでの条件付き確率によってp-valueが算出される。
- フィッシャーの正確検定は漸近分布を仮定しないため、サンプルサイズの大小は問題とならない。