補足. 分割表における検定_尤度比検定統計量の導出

$\gdef \vec#1{\boldsymbol{#1}} \\ \gdef \rank {\mathrm{rank}} \\ \gdef \det {\mathrm{det}} \\ \gdef \Bern {\mathrm{Bern}} \\ \gdef \Bin {\mathrm{Bin}} \\ \gdef \Mn {\mathrm{Mn}} \\ \gdef \Cov {\mathrm{Cov}} \\ \gdef \Po {\mathrm{Po}} \\ \gdef \HG {\mathrm{HG}} \\ \gdef \Geo {\mathrm{Geo}}\\ \gdef \N {\mathrm{N}} \\ \gdef \LN {\mathrm{LN}} \\ \gdef \U {\mathrm{U}} \\ \gdef \t {\mathrm{t}} \\ \gdef \F {\mathrm{F}} \\ \gdef \Exp {\mathrm{Exp}} \\ \gdef \Ga {\mathrm{Ga}} \\ \gdef \Be {\mathrm{Be}} \\ \gdef \NB {\mathrm{NB}} \\ \gdef \indep {\mathop{\perp\!\!\!\!\perp}} \\ \gdef \tr {\mathrm{tr}}$

<分割表の統計モデル>では以下の様な3パターンを扱いました:①どこもfixされない場合、②総和がfixされる場合、③列和または行和がfixされる場合。


いずれのパターンについても、尤度比検定統計量$L$は、
$$\begin{aligned} L &= 2 \log \frac{\prod_{i,j} O_{ij}^{O_{ij}}}{\prod_{i,j} E_{ij}^{O_{ij}}} \end{aligned}$$となり、ここではそれを示します。



ただし、・$O_{ij}, E_{ij}$は以下の通りです。

・$O_{ij}$:観測度数
・$E_{ij}$:期待度数(帰無仮説の下で最尤推定に基づいて期待される各セルの度数)

(証明) パターン①の場合

$$\begin{aligned} L &= 2 \log \frac{\prod_{i,j} e^{-\hat{\theta}_{ij}} \frac{\hat{\theta}_{ij}^{O_{ij}}}{O_{ij}!}}{\prod_{i,j} e^{-\tilde{\theta}_{ij}} \frac{\tilde{\theta}_{ij}^{O_{ij}}}{O_{ij}!}} \\[10px] &= 2 \log \frac{\prod_{i,j} e^{-\hat{\theta}_{ij}} \hat{\theta}^{O_{ij}}_{ij}}{\prod_{i,j} e^{-\tilde{\theta}_{ij}} \tilde{\theta}^{O_{ij}}_{ij}} \\ &{\scriptsize(O_{ij}!が分母分子で打ち消しあった)} \\[10px] &= 2 \log \frac{\prod_{i,j} e^{-O_{ij}} O^{O_{ij}}_{ij}}{\prod_{i,j} e^{-E_{ij}} E^{O_{ij}}_{ij}} \\ &{\scriptsize(\hat{\theta}_{ij} = O_{ij}, \tilde{\theta}_{ij} = E_{ij})} \end{aligned}$$となる。


ここでこの$L$の一部分として以下の$\bullet$を考える。
$$\begin{aligned} \bullet = \frac{\prod_{i,j} e^{-O_{ij}}}{\prod_{i,j} e^{-E_{ij}}} = \frac{\prod_{i,j} e^{-O_{ij}}}{\prod_{i,j} e^{-\frac{O_{i \bullet} O_{\bullet j}}{O_{\bullet \bullet}}}} \end{aligned}$$


$\log$をとると、
$$\begin{aligned} \log \bullet &= \sum_{i,j} (-O_{ij} + \frac{O_{i \bullet} O_{\bullet j}}{O_{\bullet \bullet}}) \\[10px] &= -\sum_{i,j} O_{ij} + \frac{1}{O_{\bullet \bullet}} \sum_{i,j} (O_{i \bullet} O_{\bullet j}) \\[10px] &= -\sum_{i,j} O_{ij} + \frac{1}{O_{\bullet \bullet}} (\sum_{i} O_{i \bullet})(\sum_{j} O_{\bullet j}) \\[10px] &= -\sum_{i,j} O_{ij} + \frac{1}{O_{\bullet \bullet}} (O_{\bullet \bullet})^2 \\[10px] &= 0 \end{aligned}$$となるため、$\bullet = 1$、となる。




以上より、
$$\begin{aligned} L &= 2 \log \frac{\prod_{i,j} O_{ij}^{O_{ij}}}{\prod_{i,j} E_{ij}^{O_{ij}}} \end{aligned}$$

(証明) パターン②の場合

$$\begin{aligned} L &= 2 \log \frac{\frac{n!}{\prod_{i,j} O_{ij}!} \prod_{i,j} \hat{p}_{ij}^{O_{ij}}}{\frac{n!}{\prod_{i,j} O_{ij}!} \prod_{i,j} \tilde{p}_{ij}^{O_{ij}}} \\[10px] &= 2 \log \frac{\prod_{i,j} \hat{p}_{ij}^{O_{ij}}}{\prod_{i,j} \tilde{p}_{ij}^{O_{ij}}} \\ &{\scriptsize(分母分子の前半部分が打ち消しあった)} \\[10px] &= 2 \log \frac{\prod_{i,j} (\frac{O_{ij}}{O_{\bullet \bullet}})^{O_{ij}}}{\prod_{i,j} (\frac{E_{ij}}{O_{\bullet \bullet}})^{O_{ij}}} \\ &{\scriptsize(\hat{p}_{ij}=\frac{O_{ij}}{O_{\bullet \bullet}}, \tilde{p}_{ij}=\frac{E_{ij}}{O_{\bullet \bullet}})} \\[10px] &= 2 \log \frac{\prod_{i,j} O_{ij}^{O_{ij}}}{\prod_{i,j} E_{ij}^{O_{ij}}} \end{aligned}$$となる。

(証明) パターン③の場合

$$\begin{aligned} L &= 2 \log \frac{\prod_{j} \{ \frac{n_j!}{\prod_i O_{ij}!} \prod_i \hat{p}_{ij}^{O_{ij}} \}}{\prod_{j} \{ \frac{n_j!}{\prod_i O_{ij}!} \prod_i \tilde{p}_{ij}^{O_{ij}} \}} \\[10px] &= 2 \log \frac{\prod_{j} \prod_{i} \hat{p}_{ij}^{O_{ij}}}{\prod_{j} \prod_{i}\tilde{p}_{ij}^{O_{ij}}} \\ &{\scriptsize(分母分子の前半部分が打ち消しあった)} \\[10px] &= 2 \log \frac{\prod_{j} \prod_{i} (\frac{O_{ij}}{O_{\bullet j}})^{O_{ij}}}{\prod_{j} \prod_{i} (\frac{O_{i \bullet}}{O_{\bullet \bullet}})^{O_{ij}}} \\ &{\scriptsize(\hat{p}_{ij}=\frac{O_{ij}}{O_{\bullet j}}, \tilde{p}_{ij}=\frac{O_{i \bullet}}{O_{\bullet \bullet}})} \\[10px] &= 2 \log \frac{\prod_{j} \prod_{i} O_{ij}^{O_{ij}}}{\prod_{j} \prod_{i} (\frac{O_{i \bullet} O_{\bullet j}}{O_{\bullet \bullet} })^{O_{ij}}} \\[10px] &= 2 \log \frac{\prod_{i,j} O_{ij}^{O_{ij}}}{\prod_{i,j} E_{ij}^{O_{ij}}} \end{aligned}$$となる。