$\gdef \vec#1{\boldsymbol{#1}} \\ \gdef \rank {\mathrm{rank}} \\ \gdef \det {\mathrm{det}} \\ \gdef \Bern {\mathrm{Bern}} \\ \gdef \Bin {\mathrm{Bin}} \\ \gdef \Mn {\mathrm{Mn}} \\ \gdef \Cov {\mathrm{Cov}} \\ \gdef \Po {\mathrm{Po}} \\ \gdef \HG {\mathrm{HG}} \\ \gdef \Geo {\mathrm{Geo}}\\ \gdef \N {\mathrm{N}} \\ \gdef \LN {\mathrm{LN}} \\ \gdef \U {\mathrm{U}} \\ \gdef \t {\mathrm{t}} \\ \gdef \F {\mathrm{F}} \\ \gdef \Exp {\mathrm{Exp}} \\ \gdef \Ga {\mathrm{Ga}} \\ \gdef \Be {\mathrm{Be}} \\ \gdef \NB {\mathrm{NB}}$
今回は『基本的な統計量』が従う分布を確認していきます。
そもそもですが、「統計量」とは何でしたでしょうか?
「統計量」とは観測データから構成された量のことです。
また、検定・区間推定のために使用される統計量のことを特に「検定統計量」と言います。
それでは、観測データから構成される量は何でも統計量と言えるのでしょうか?
そうですね。
今回扱うのは、標本が独立に正規分布に従う時の基本的な(検定)統計量となります。
(注意)
- 今回扱う(検定)統計量を検定・区間推定にどう活かすのかについては、<正規分布の検定・区間推定>をご参照ください。
1. $\frac{{\bar X_n}-\mu}{\frac{\sigma}{\sqrt n}}$
(事実)
$X_i \overset{i.i.d}\sim \N(\mu, \sigma^2) ~ {\small (i=1, \ldots, n)}$である時、 $$\begin{aligned} \frac{{\bar X_n}-\mu}{\frac{\sigma}{\sqrt n}} \sim \N(0,1) \end{aligned}$$となります。
(証明)
まず${\bar X_n}$の平均$E[{\bar X_n}]$、分散$V[{\bar X_n}]$を求める。
$E[{\bar X_n}]$については、
$$\begin{aligned} E[{\bar X_n}] &= E[\frac{1}{n} \sum_{i=1}^n X_i] \\[10px] &= \frac{1}{n} \sum_{i=1}^n E[X_i] \\[10px] &= \frac{1}{n} \sum_{i=1}^n \mu \\[10px] &= \frac{1}{n} \cdot n \mu \\[10px] &= \mu \end{aligned}$$となる。
また、$V[{\bar X_n}]$については、
$$\begin{aligned} V[{\bar X_n}] &= V[\frac{1}{n} \sum_{i=1}^n X_i] \\[10px] &= (\frac{1}{n})^2 \cdot V[\sum_{i=1}^n X_i] \\[10px] &= (\frac{1}{n})^2 \cdot \sum_{i=1}^n V[X_i] \\ &{\scriptsize (X_i(i=1, \ldots, n)の独立性から)} \\[10px] &= (\frac{1}{n})^2 \cdot \sum_{i=1}^n \sigma^2 \\[10px] &= (\frac{1}{n})^2 \cdot n \sigma^2 \\[10px] &= \frac{\sigma^2}{n} \end{aligned}$$となる。
一方で、互いに独立に正規分布に従う確率変数の和は正規分布に従うことから(参照:<連続分布>:「2. (単変量)正規分布」)、${\bar X_n}$の分布型は正規分布である。
以上から、
$$\begin{aligned} {\bar X_n} \sim \N(\mu, \frac{\sigma^2}{n}) \end{aligned}$$となり、これを正規化すると、
$$\begin{aligned} \frac{{\bar X_n} – \mu}{\frac{\sigma}{\sqrt n}} \sim \N(0,1) \end{aligned}$$が成立する。
2. $\frac{(n-1) s^2}{\sigma^2}$
(事実)
$X_i \overset{i.i.d}\sim \N(\mu, \sigma^2) ~ {\small (i=1, \ldots, n)}$である時、 $$\begin{aligned} \frac{(n-1) s^2}{\sigma^2} (= \frac{\sum_{i=1}^n(X_i – {\bar X_n})^2}{\sigma^2}) \sim \chi^2(\boldsymbol{n-1}) \end{aligned}$$
(ただし、$s^2 = \frac{1}{n-1} \sum_{i=1}^n (X_i-{\bar X_n})^2$)
となります。
(証明)
(この証明はややテクニカルなので、難しく感じる方は一旦飛ばしていただいて構いません)
(1. 行列$H$の導入)
行列$H$を以下の様に定める。
($1$行目が$(\frac{1}{\sqrt n}~\frac{1}{\sqrt n} \cdots \frac{1}{\sqrt n})$である正規直行系の$1$つ)
$$\begin{aligned} H = \begin{pmatrix} \frac{1}{\sqrt n} & \frac{1}{\sqrt n} & \cdots & \cdots & \cdots & \frac{1}{\sqrt n} \\[5px] – \frac{1}{\sqrt 2} & \frac{1}{\sqrt 2} & 0 & \cdots & \cdots & 0 \\[5px] – \frac{1}{\sqrt{2 \cdot 3}} & – \frac{1}{\sqrt{2 \cdot 3}} & \frac{2}{\sqrt{2 \cdot 3}} & 0 & \cdots & 0 \\[5px] \vdots & \vdots & \vdots & \vdots & \vdots & \vdots \\[5px] – \frac{1}{\sqrt{(n-1)n}} & – \frac{1}{\sqrt{(n-1)n}} & – \frac{1}{\sqrt{(n-1)n}} & \cdots & – \frac{1}{\sqrt{(n-1)n}} & \frac{n-1}{\sqrt{(n-1)n}} \end{pmatrix} \end{aligned}$$
すると、
$$\begin{aligned} H^{\top} H (= H H^{\top}) = I ~ {\small (単位行列)} \end{aligned}$$が成立している。
(2. 行列$H$を用いた変数変換による$\vec Y$の産生)
$\vec X = (X_1, \cdots, X_n)^{\top}$とすると、$\vec X \sim \N_n(\vec \mu, \sigma^2 I)$である。
(ただし、$\vec \mu = (\mu, \cdots ,\mu)^{\top}$)
ここで、新たな確率ベクトル$\vec Y= (Y_1, \cdots, Y_n)^{\top}$を以下の様に産み出すとする。
$$\begin{aligned} \vec Y = H \frac{\vec X-\vec \mu}{\sigma} \end{aligned}$$
(3. $\vec Y$が従う分布の導出)
すると、$E[\vec Y], V[\vec Y]$について、
$$\begin{aligned} E[\vec Y] &= E[H \frac{\vec X-\vec \mu}{\sigma}] \\[10px] &= H E[\frac{\vec X-\vec \mu}{\sigma}] \\[10px] &= \vec 0 \\ &{\scriptsize (\frac{\vec X-\vec \mu}{\sigma} \sim \N_n(\vec 0, I)より)} \end{aligned}$$
$$\begin{aligned} V[\vec Y] &= E[\vec Y^{\top} \vec Y]-(E[\vec Y])^{\top} (E[\vec Y]) \\[10px] &= E[(H \frac{\vec X-\vec \mu}{\sigma})^{\top} (H \frac{\vec X-\vec \mu}{\sigma})] \\ &{\scriptsize (E[\vec Y]= \vec 0である)} \\[10px] &= E[(\frac{\vec X-\vec \mu}{\sigma})^{\top} H^{\top} H (\frac{\vec X-\vec \mu}{\sigma})] \\[10px] &= E[(\frac{\vec X-\vec \mu}{\sigma})^{\top} (\frac{\vec X-\vec \mu}{\sigma})] \\ &{\scriptsize (H^{\top} H = Iより)} \\[10px] &= V[\frac{\vec X-\vec \mu}{\sigma}] + (E[\frac{\vec X-\vec \mu}{\sigma}])^{\top} (E[\frac{\vec X-\vec \mu}{\sigma}]) \\[10px] &= I + O \\ &{\scriptsize (\frac{\vec X-\vec \mu}{\sigma} \sim \N_n(\vec 0, I)より)} \\[10px] &= I \end{aligned}$$
ところで、多変量正規分布に従う確率ベクトルの線形変換先も多変量正規分布に従う。
(参照:<連続分布>:「2. (単変量)正規分布」。←こちらでは単変量の場合を紹介したが多変量でも成立する。)
以上から、
$$\begin{aligned} \vec Y \sim \N_n(\vec 0, I) ~~~~~ \mathrm{(A)} \end{aligned}$$が成立する。(これは、$Y_i \overset{i.i.d}\sim \N(0, 1) ~~ {\small (i=1, \ldots, n)}$、と同義)
(4. $Y_1$と$\sum_{i=2}^n Y_i^2$の計算)
ところで、$Y_1$と$\sum_{i=2}^n Y_i^2$を計算すると、
$$\begin{aligned} Y_1 &= \frac{1}{\sqrt n} \sum_{i=1}^n \frac{X_i-\mu}{\sigma} \\[10px] &= \frac{1}{\sqrt n} \cdot \frac{\sum_{i=1}^n X_i-\sum_{i=1}^n \mu}{\sigma} \\[10px] &= \frac{1}{\sqrt n} \cdot \frac{n {\bar X_n}-n \mu}{\sigma} \\[10px] &= \frac{\sqrt{n} (\bar{X_n}-\mu)}{\sigma} ~~~~~ \mathrm{(B)} \end{aligned}$$
$$\begin{aligned} \sum_{i=2}^n Y_i^2 &= \vec Y^{\top} \vec Y-Y_1^2 \\[10px] &= \sum_{i=1}^n (\frac{X_i-\mu}{\sigma})^2-(\frac{\sqrt{n} (\bar{X_n}-\mu)}{\sigma})^2 \\ &{\scriptsize ((B)より)} \\[10px] &= \frac{\sum_{i=1}^n(X_i-\mu)^2-n(\bar{X_n}-\mu)^2}{\sigma^2} \\[10px] &= \frac{\sum_{i=1}^n(X_i-{\bar X_n})^2}{\sigma^2} ~~~~~ \mathrm{(C)} \\ &{\scriptsize (\sum_{i=1}^n(X_i-{\bar X_n})^2 = \sum_{i=1}^n(X_i-\mu)^2-n(\bar{X_n}-\mu)^2)} \end{aligned}$$となる。
(5. まとめ)
$\mathrm{(A), (C)}$から$\frac{\sum_{i=1}^n(X_i – {\bar X_n})^2}{\sigma^2}$は、互いに独立に$\N(0,1)$に従う確率変数の$(n-1)$個の$2$乗和($\sum_{i=2}^n Y_i^2$)となっているので、$\chi^2$分布の性質から(参照:<連続分布>:「6. $\chi^2$分布」)、
$$\begin{aligned} \frac{(n-1) s^2}{\sigma^2} (= \frac{\sum_{i=1}^n(X_i-{\bar X_n})^2}{\sigma^2}) \sim \chi^2(n-1) \end{aligned}$$
(ただし、$s^2 = \frac{1}{n-1} \sum_{i=1}^n (X_i-{\bar X_n})^2$)
が成立する。
- $\mathrm{(A), (B), (C)}$から$\frac{\sqrt{n} (\bar{X_n}-\mu)}{\sigma}, \frac{\sum_{i=1}^n(X_i-{\bar X_n})^2}{\sigma^2}$は互いに独立であることがわかります。
この事実も重要なので押さえておいてください。
3. $\frac{{\bar X_n}-\mu}{\frac{s}{\sqrt n}}$
(事実)
$X_i \overset{i.i.d}\sim \N(\mu, \sigma^2) ~ {\small (i=1, \ldots, n)}$である時、 $$\begin{aligned} \frac{\bar{X_n}-\mu}{\frac{s}{\sqrt n}} \sim \t(\boldsymbol{n-1}) \end{aligned}$$
(ただし、$s^2 = \frac{1}{n-1} \sum_{i=1}^n (X_i-{\bar X_n})^2$)
となります。
『1. $\frac{{\bar X_n} – \mu}{\frac{\sigma}{\sqrt n}}$』には$\sigma$が含まれていましたが、ここには$\sigma$が含まれていませんね。
検定・区間推定では$\sigma$が既知が未知かによって、これらの統計量を使い分けることになります。
(証明)
$\frac{\bar{X_n}-\mu}{\frac{s}{\sqrt n}}$について、
$$\begin{aligned} \frac{\bar{X_n}-\mu}{\frac{s}{\sqrt n}} &= \frac{\frac{\bar{X_n}-\mu}{\frac{1}{\sqrt n}}}{\sqrt{\frac{(n-1) s^2}{(n-1)}}} \\[10px] &= \frac{\frac{\bar{X_n}-\mu}{\frac{\sigma}{\sqrt n}}}{\sqrt{\frac{\frac{(n-1) s^2}{\sigma^2} }{(n-1)}}} \end{aligned}$$と変形できるが、分母の一部$\frac{(n-1) s^2}{\sigma^2}$、分子$\frac{\bar{X_n}-\mu}{\frac{\sigma}{\sqrt n}}$それぞれについて、
$$\begin{aligned} \frac{(n-1) s^2}{\sigma^2} &\sim \chi^2(n-1) \\[10px] \frac{\bar{X_n}-\mu}{\frac{\sigma}{\sqrt n}} &\sim \N(0,1) \end{aligned}$$が成立する。(『2. $\frac{(n-1) s^2}{\sigma^2}$』参照)
$\frac{(n-1) s^2}{\sigma^2}$、$\frac{\bar{X_n}-\mu}{\frac{\sigma}{\sqrt n}}$は互いに独立なので(『2. $\frac{(n-1) s^2}{\sigma^2}$』参照)、$\t$分布の性質から(参照:<連続分布>:「7. $\t$分布」)、
$$\begin{aligned} \frac{\bar{X_n}-\mu}{\frac{s}{\sqrt n}} \sim \t(n-1) \end{aligned}$$
(ただし、$s^2 = \frac{1}{n-1} \sum_{i=1}^n (X_i-{\bar X_n})^2$)
が成立する。
書籍によっては、『1. $\frac{{\bar X_n} – \mu}{\frac{\sigma}{\sqrt n}}$』→『3. $\frac{{\bar X_n} – \mu}{\frac{s}{\sqrt n}}$』→『2. $\frac{(n-1) s^2}{\sigma^2}$』の順に紹介されていますが、『3. $\frac{{\bar X_n} – \mu}{\frac{s}{\sqrt n}}$』の証明に『2. $\frac{(n-1) s^2}{\sigma^2}$』の内容を使いたかったため、この様な順としました。
4. $\frac{\frac{s_1^2}{\sigma_1^2}}{\frac{s_2^2}{\sigma_2^2}}$
(事実)
$X_i \overset{i.i.d}\sim \N(\mu_1, \sigma_1^2) ~ {\small (i=1, \ldots, n_1)}, ~ Y_j \overset{i.i.d}\sim \N(\mu_2, \sigma_2^2) ~ {\small (j=1, \ldots, n_2)}$である時、 $$\begin{aligned} \frac{\frac{s_1^2}{\sigma_1^2}}{\frac{s_2^2}{\sigma_2^2}} \sim \F(\boldsymbol{n_1-1, n_2-1}) \end{aligned}$$
(ただし、$s_1^2 = \frac{1}{n_1-1} \sum_{i=1}^{n_1} (X_i-{\bar X_{n_1}})^2, ~ s_2^2 = \frac{1}{n_2-1} \sum_{j=1}^{n_2} (Y_j-{\bar Y_{n_2}})^2$)
となります。
(証明)
$\frac{\frac{s_1^2}{\sigma_1^2}}{\frac{s_2^2}{\sigma_2^2}}$について、 $$\begin{aligned} \frac{\frac{s_1^2}{\sigma_1^2}}{\frac{s_2^2}{\sigma_2^2}} &= \frac{\frac{\frac{(n_1-1) s_1^2}{\sigma_1^2}}{(n_1-1)}}{\frac{\frac{(n_2-1) s_2^2}{\sigma_2^2}}{(n_2-1)}} \end{aligned}$$と変形できるが、分母の一部$\frac{(n_2-1) s_2^2}{\sigma_2^2}$、分子の一部$\frac{(n_1-1) s_1^2}{\sigma_1^2}$それぞれについて、
$$\begin{aligned} \frac{(n_1-1) s_1^2}{\sigma_1^2} &\sim \chi^2(n_1-1) \\ \frac{(n_2-1) s_2^2}{\sigma_2^2} &\sim \chi^2(n_2-1) \end{aligned}$$が成立する。(『2. $\frac{(n-1) s^2}{\sigma^2}$』参照)
$\frac{(n_1-1) s_1^2}{\sigma_1^2}$、$\frac{(n_2-1) s_2^2}{\sigma_2^2}$は互いに独立なので、$\F$分布の性質から(参照:<連続分布>:「9. $\F$分布」)、
$$\begin{aligned} \frac{\frac{s_1^2}{\sigma_1^2}}{\frac{s_2^2}{\sigma_2^2}} \sim \F(n_1-1, n_2-1) \end{aligned}$$
(ただし、$s_1^2 = \frac{1}{n_1-1} \sum_{i=1}^{n_1} (X_i-{\bar X_{n_1}})^2, ~ s_2^2 = \frac{1}{n_2-1} \sum_{j=1}^{n_2} (Y_j-{\bar Y_{n_2}})^2$)
が成立する。
今回扱った$4$つの統計量は検定・区間推定で頻出なので、必ず覚えておいて下さい。
まとめ.
- 標本が独立に正規分布に従う時の基本的な(検定)統計量について、それが従う分布を確認した。