統計学

お遊び2:分布に慣れ親しもう〜離散分布編〜

$\gdef \vec#1{\boldsymbol{#1}} \\ \gdef \rank {\mathrm{rank}} \\ \gdef \det {\mathrm{det}} \\ \gdef \Bern {\mathrm{Bern}} \\ \gdef \Bin {\mathrm{Bin}} \\ \gdef \Mn {\mathrm{Mn}} \\ \gdef \Cov {\mathrm{Cov}} \\ \gdef \Po {\mathrm{Po}} \\ \gdef \HG {\mathrm{HG}} \\ \gdef \Geo {\mathrm{Geo}}\\ \gdef \N {\mathrm{N}} \\ \gdef \LN {\mathrm{LN}} \\ \gdef \U {\mathrm{U}} \\ \gdef \t {\mathrm{t}} \\ \gdef \F {\mathrm{F}} \\ \gdef \Exp {\mathrm{Exp}} \\ \gdef \Ga {\mathrm{Ga}} \\ \gdef \Be {\mathrm{Be}} \\ \gdef \NB {\mathrm{NB}}$

学習者

これまで分布を勉強してきましたが、とにかく数が多いですね。。

すたどく

それは間違いないです。

学習者

各分布のイメージを確立したいのですが、よい方法はありませんか?

すたどく

イメージを確立するために、2つの提案をしたいと思います。

①分布を表す記号とパラメータの意味を覚えましょう
②直感的にグラフを書ける様にしましょう

学習者

ほぅ。。。

すたどく

①については例えば、『正規分布が一般に$\N(\mu, \sigma^2)$で表され、$\mu$は平均を、$\sigma^2$は分散を表す』ということを覚えるということです。

②については例えば、正規分布$\N(\mu, \sigma^2)$のグラフを書ける様にしてパラメータ$(\mu, \sigma^2)$を変化させた時にどうグラフが変化するかをイメージできるようにする、ということです。

学習者

なるほど。分布に少し慣れ親しむことができそうです。

0. まず始めに

ここでは各離散分布について、
①分布の定義と確率関数
②(分布の)記号
③グラフ
を提示していきます。

②(分布の)記号」を暗記し、そのパラメータの意味を「①分布の定義と確率関数」と照らし合わせて覚えましょう。
また、「③グラフ」を直感的に書ける様にしてみて下さい。


(注意)

  • ここでの各分布の番号は<離散分布>における番号と同じものを使用しています。
  • <離散分布>ではグラフを棒グラフとしましたが、ここでは(手書きのしやすさから)折れ線グラフで描きます(ただし、ベルヌーイ分布、多項分布を除く)

1. ベルヌーイ分布

1-1. 分布の定義と確率関数

(定義)
『確率$p ~(0 \leqq p \leqq 1)$で「$1$」を、確率$(1-p)$で「$0$」をとる確率変数』が従う分布

(確率関数)
$$\begin{aligned} p(x) (= Pr\{ X=x \}) = p^x (1-p)^{1-x} ~~ (x=0, 1) \end{aligned}$$

1-2. (分布の)記号

$$\begin{aligned} \Bern(p) \end{aligned}$$

すたどく

“Bern”は”Bernoulli(ベルヌーイ)”から由来しています。
パラメータは$1$つ(”$p$”)で、”$p$”は「$1$」をとる確率です。

1-3. グラフ

Fig1. 確率関数

すたどく

グラフはとてもシンプルです。

2. 二項分布

2-1. 分布の定義と確率関数

(定義)
『「確率$p ~(0 \leqq p \leqq 1)$で「$1$」を、確率$(1-p)$で「$0$」をとる」というベルヌーイ試行を$n {\small (\in \mathbb{N})}$回行った時に出た「$1$」の回数(または合計)』が従う分布

(確率関数)
$$\begin{aligned} p(x) (= Pr\{ X=x \}) = \binom{ n }{ x } p^x (1-p)^{n – x} ~~ (x = 0, \ldots, n) \end{aligned}$$

2-2. (分布の)記号

$$\begin{aligned} \Bin (n, p) \end{aligned}$$

すたどく

“Bin”は”Binomial(二項)”から由来しています。
パラメータは$2$つ(”$n, p$”)で、”$n$”は試行回数、”$p$”は「$1$」をとる確率です。

2-3. グラフ

Fig2_1. 確率関数($n$を変化)

すたどく

$p=0.3$で固定して$n$を変化させています。$n=5$だとゆがみが目立ちますが、$n=50$だとゆがみが目立たず、正規分布の形状に類似していますね。(参照:<二項分布・ポアソン分布の正規近似>

Fig2_2. 確率関数($p$を変化)

すたどく

$n=25$で固定して$p$を変化させています。$p=0.5$だと左右対称ですが、その他の場合には左右非対称ですね。

3. 多項分布

3-1. 分布の定義と確率関数

(定義)
「確率$p_i~(0 \leqq p_i \leqq 1)$」でカテゴリー$i$を選択する$(i = 1, \ldots, K; \sum_{i=1}^K p_i = 1)$」というカテゴリカル試行を$n {\small (\in \mathbb{N})}$回行った時に、選択されたカテゴリー$i$の個数を$X_i$とする。この時、確率ベクトル$\vec X = (X_1, \ldots, X_K)^\top$が従う分布。

(確率関数)
$$\begin{aligned} p(\vec x) (&= Pr\{ \vec X= \vec x \} = Pr\{ X_1=x_1, \ldots, X_K=x_K \} ) \\ &= \frac{n!}{x_1! \cdots x_K!} p_1^{x_1} \cdots p_K^{x_K} \end{aligned}$$

3-2. (分布の)記号

$$\begin{aligned} \Mn (n; p_1, \ldots, p_K) \end{aligned}$$

すたどく

“Mn”は”Multinomial(多項)”から由来しています。
パラメータは$(K+1)$つ(”$n, p_1, \ldots, p_K$”)で、”$n$”は試行回数、
“$p_i ~{\small (i=1, \ldots, K)}$”は「カテゴリー$i$」をとる確率です。
パラメータは$(K+1)$つですが、$\sum_{i=1}^{K} p_i=1$という制約条件があるため、パラメータの自由度は$K$となります。

3-3. グラフ

$3$項分布$\Mn(n; p_1, p_2, p_3)$(ただし$p_1+p_2+p_3=1$)の場合を提示します。

Fig3. 確率関数

すたどく

$X_2 = x_2$で条件づけると(切断すると)、$X_1$の分布は二項分布となっています。
また、$X_1 = x_1$で条件づけると(切断すると)、$X_2$の分布も二項分布となっています。

4. ポアソン分布

4-1. 分布の定義と確率関数

(定義)
『単位時間に(各時点でランダムに)平均$\lambda {\small ( \gt 0)}$回生じるイベントが単位時間あたりに生じる合計回数』が従う分布

(確率関数)
$$\begin{aligned} p(x) (= Pr\{ X=x \}) = \frac{e^{- \lambda} \lambda^x}{x!} ~~ (x = 0, 1, \cdots) \end{aligned}$$

4-2. (分布の)記号

$$\begin{aligned} \Po (\lambda) \end{aligned}$$

すたどく

“Po”は”Poisson(ポアソン)”から由来しています。
パラメータは$1$つ(”$\lambda$”)で、”$\lambda$”は『単位時間あたりのイベントの平均発生回数』です。

4-3. グラフ

Fig4. 確率関数

すたどく

$\Po (\lambda_0)$のグラフのピークは$\lambda_0$付近にきていることを確認してください。
また、$\lambda$が大きくなるにつれてゆがみが目立たなくなり、正規分布の形状に類似していますね。(参照:<二項分布・ポアソン分布の正規近似>

5. 超幾何分布

5-1. 分布の定義と確率関数

(定義)
『「$1$」または「$0$」が入った箱(合計$N$枚、うち「$1$」は$M$枚)に対して、$n$回の非復元抽出をした時の、「$1$」が出る回数』が従う分布

(確率関数)
$$\begin{aligned} p(x) (= Pr\{ X=x \}) = \frac{\displaystyle \binom{M}{x} \cdot \binom{N-M}{n-x}}{ \displaystyle \binom{N}{n}} \\\\ ({\small ただし}\max\{ 0, n-(N-M) \} \leqq x \leqq \min\{n, M\}) \end{aligned}$$

5-2. (分布の)記号

$$\begin{aligned} \HG (N, M, n) \end{aligned}$$

すたどく

“HG”は”Hyper(超) Geometric(幾何)”から由来しています。
パラメータは$3$つ(”$N, M, n$”)で、”$N$”は「$1$」/「$0$」の合計枚数、
“$M$”は「$1$」の合計枚数、”$n$”は非復元抽出の回数です。

5-3. グラフ

Fig5. 確率関数

すたどく

$(N,M)=(200,120)$に固定して$n$を変化させています。
当たり前ですが、抽出回数である$n$が大きくなればなるほど、グラフは右側に移動しています。
そして、抽出回数$n$が$0, 200$付近ではグラフが鋭になっていくのがわかります。

6. 幾何分布

6-1. 分布の定義と確率関数

(定義)
『割合$p ~(0 \leqq p \leqq 1)$」で「$1$」が、割合$(1-p)$で「$0$」が入った箱から復元抽出をくり返す時、「$1$」が$1$回出るまでの全抽出回数(「$1$」「$0$」の合計枚数)』が従う分布*

(*:上記の『「$1$」「$0$」の合計枚数』部分を『「$0$」の合計枚数』として幾何分布を定義する流派もありますが、本サイトでは上記の流派を採用します)

(確率関数)
$$\begin{aligned} p(x) (= Pr\{ X=x \}) = p(1-p)^{x-1} ~~ (x=1, 2, \ldots) \end{aligned}$$

6-2. (分布の)記号

$$\begin{aligned} \Geo(p) \end{aligned}$$

すたどく

“Geo”は”Geometric(幾何)”から由来しています。
パラメータは$1$つ(”$p$”)で、”$p$”は「$1$」をとる確率(「$1$」の割合)です。

6-3. グラフ

Fig6. 確率関数

すたどく

$p(1)=p$なので$p$が小さくなればなるほど$p(1)$の値は小さくなり、その分グラフは平べったくなりますね。(←曲線下の面積はいずれも$1$と決まっています)

7. 負の二項分布

7-1. 分布の定義と確率関数

(定義)
『割合$p ~(0 \leqq p \leqq 1)$」で「$1$」が、割合$(1-p)$で「$0$」が入った箱から復元抽出をくり返す時、「$1$」が$r {\small (\in \mathbb{N})}$回出るまでの全抽出回数(「$1$」「$0$」の合計枚数)』が従う分布*

(*:上記の『「$1$」「$0$」の合計枚数』部分を『「$0$」の合計枚数』として負の二項分布を定義する流派もありますが、本サイトでは上記の流派を採用します)

(確率関数)
$$\begin{aligned} p(x) (= Pr\{ X=x \}) &= \binom{x-1}{r-1} p^{r-1} (1-p)^{x-r} p \\ &= \binom{x-1}{r-1} p^r (1-p)^{x-r} ~~ {\small (x=r, r+1, \ldots)} \end{aligned}$$

7-2. (分布の)記号

$$\begin{aligned} \NB (r, p) \end{aligned}$$

すたどく

“NB”は”Negative(負の) Binomial(二項)”から由来しています。
パラメータは$2$つ(”$r, p$”)で、”$r$”は試行回数を決める「$1$」の枚数、”$p$”は「$1$」をとる確率(「$1$」の割合)です。

7-3. グラフ

Fig7_1. 確率関数($r$を変化)

すたどく

$p=0.7$で固定して$r$を変化させています。試行回数を決める「$1$」の枚数$r$が大きくなればなるほど、グラフは右側に移動しています。

Fig7_2. 確率関数($p$を変化)

すたどく

$r=5$で固定して$p$を変化させています。$p=0.5$においても左右非対称であることに気を付けて下さい。

まとめ.

  • 各離散分布に慣れるべく、①分布の定義と確率関数、②(分布の)記号、③グラフ、を確認した。
他の記事を参照されたい方はこちら

 サイトマップからお好きな記事をお探しください。