$\gdef \vec#1{\boldsymbol{#1}} \\ \gdef \rank {\mathrm{rank}} \\ \gdef \det {\mathrm{det}} \\ \gdef \Bern {\mathrm{Bern}} \\ \gdef \Bin {\mathrm{Bin}} \\ \gdef \Mn {\mathrm{Mn}} \\ \gdef \Cov {\mathrm{Cov}} \\ \gdef \Po {\mathrm{Po}} \\ \gdef \HG {\mathrm{HG}} \\ \gdef \Geo {\mathrm{Geo}}\\ \gdef \N {\mathrm{N}} \\ \gdef \LN {\mathrm{LN}} \\ \gdef \U {\mathrm{U}} \\ \gdef \t {\mathrm{t}} \\ \gdef \F {\mathrm{F}} \\ \gdef \Exp {\mathrm{Exp}} \\ \gdef \Ga {\mathrm{Ga}} \\ \gdef \Be {\mathrm{Be}} \\ \gdef \NB {\mathrm{NB}}$
0. まず始めに
ここでは各連続分布について、
①確率密度関数
②(分布の)記号
③グラフ
を提示していきます。
「②(分布の)記号」を暗記し、そのパラメータの意味を覚えましょう。
(ただし、パラメータの意味を解釈しがたいものもあります)
また、「③グラフ」を直感的に書ける様にしてみて下さい。
(注意)
ここでの各分布の番号は<連続分布>における番号と同じものを使用しています。
1. (連続)一様分布
1-1. 確率密度関数
$$\begin{aligned} f(x) = \dfrac{1}{b-a} ~~ (a \leqq x \leqq b) \end{aligned}$$
(ただし、$a, b \in \mathbb{R}, a \lt b$)
1-2. (分布の)記号
$$\begin{aligned} \U(a, b) \end{aligned}$$
“U”は”Uniform(一様)”から由来しています。
パラメータは$2$つ(”$a,b$”)で、”$a,b$”は$f(x) \neq 0$なる$x$の範囲を規定します。
1-3. グラフ
Fig1. 確率密度関数
グラフはとてもシンプルです。
2. (単変量)正規分布
2-1. 確率密度関数
$$\begin{aligned} f(x) = \dfrac{1}{\sqrt{2 \pi \sigma^2}} \exp[-\dfrac{(x-\mu)^2}{2 \sigma^2}] ~~ (-\infty \lt x \lt \infty) \end{aligned}$$
(ただし、$\mu \in \mathbb{R}, \sigma^2 \gt 0$)
2-2. (分布の)記号
$$\begin{aligned} \N(\mu, \sigma^2) \end{aligned}$$
“N”は”Normal(正規)”から由来しています。
パラメータは$2$つ(”$\mu, \sigma^2$”)で、”$\mu$”は(分布の)平均に、”$\sigma^2$”は(分布の)分散に相当します。
2-3. グラフ
Fig2. 確率密度関数
$\sigma^2$が大きくなればなるほど、平べったくなりますね。
3. (多変量)正規分布
3-1. 確率密度関数
$$\begin{aligned} f(\vec x) = \dfrac{1}{(2 \pi)^\frac{n}{2} (\det \vec \Sigma)^{\frac{1}{2}}} \exp[-\dfrac{1}{2} (\vec x-\vec \mu)^\top \vec \Sigma^{-1} (\vec x-\vec \mu)] ~~ (\vec x \in \mathbb{R^n}) \end{aligned}$$
(ただし、$\vec \mu (= (\mu_1, \ldots, \mu_n)^\top) \in \mathbb{R^n}, \vec \Sigma$は$n \times n$正定値行列)
3-2. (分布の)記号
$$\begin{aligned} \N_n(\vec \mu, \vec \Sigma) \end{aligned}$$
“$\N_n$”の”$_n$”は確率ベクトル$\vec X$が何個の確率変数を束ねたものかを表しています。
パラメータは$2$つ(”$\vec \mu, \vec \Sigma$”)で、”$\vec \mu$”は(分布の)平均ベクトルに、”$\vec \Sigma$”は(分布の)分散共分散行列に相当します。
3-3. グラフ
(以下Fig中に$\sigma_1, \sigma_2, \rho$が出現しますが、$\vec \Sigma = \begin{pmatrix} \sigma_1^2 & \rho \sigma_1 \sigma_2 \\[5px] \rho \sigma_1 \sigma_2 & \sigma_2^2 \end{pmatrix}$、です)
Fig3_1_a. 確率密度関数
Fig3_1_b. 確率密度関数をあるZ=zで切断した
Fig3_1_c. Fig3_1_bをZ軸方向から覗いた
(↑)$\sigma_1^2 = \sigma_2^2, \rho=0$の時は、$Z=z$で切断すると正円になりますね。
Fig3_2_a. 確率密度関数
Fig3_2_b. 確率密度関数をあるZ=zで切断した
Fig3_2_c. Fig3_2_bをZ軸方向から覗いた
(↑)$\sigma_1^2 \neq \sigma_2^2, \rho=0$の時は、$Z=z$で切断すると傾いてない楕円になりますね。
Fig3_3_a. 確率密度関数
Fig3_3_b. 確率密度関数をあるZ=zで切断した
Fig3_3_c. Fig3_3_bをZ軸方向から覗いた
(↑)$\sigma_1^2 \neq \sigma_2^2, \rho \neq 0$の時は、$Z=z$で切断すると傾いた楕円になりますね。
4. 対数正規分布
4-1. 確率密度関数
$$\begin{aligned} f(x) = \dfrac{1}{\sqrt{2 \pi \sigma^2} x} \exp[- \dfrac{(\log x-\mu)^2}{2 \sigma^2}] ~~ (x \gt 0) \end{aligned}$$
(ただし、$\mu \in \mathbb{R}, \sigma^2 \gt 0$)
4-2. (分布の)記号
$$\begin{aligned} \LN(\mu, \sigma^2) \end{aligned}$$
“LN”は”Log Normal(正規)”から由来しています。
パラメータは$2$つ(”$\mu, \sigma^2$”)です。
注意点としては、この分布の平均が$\mu$、分散が$\sigma^2$は間違いです。
対数正規分布の元と考えられる正規分布の平均が$\mu$、分散が$\sigma^2$です。
4-3. グラフ
Fig4_1. 確率密度関数($\sigma^2$を変化)
$\mu=0$で固定して$\sigma^2$を変化させています。$\sigma^2$が大きくなるにつれて、最大を与える$x$は0に近づきます。 $X \sim \LN(\mu, \sigma^2)$である時、$E[X]=\exp [\mu + \dfrac{1}{2} \sigma^2]$であったので(参照:<連続分布>:「4. 対数正規分布」)、直感的には$\sigma^2$が大きくなるにつれて最大を与える$x$が大きくなると思いがちですが逆なので注意してさい。 $f(x)$の式を$x$で微分して$=0$とした式を解くことで極大を与える$x$が解けますが、これは$x=\exp [\mu-\sigma^2]$となり、$\sigma^2$が大きくなるにつれて$0$に近づくことが確認できます。
Fig4_2. 確率密度関数($\mu$を変化)
$\sigma^2=1$で固定して$\mu$を変化させています。$\mu$が大きくなるにつれて、最大を与える$x$は大きくなります。
このことは、(前述の通り)最大を与える$x$は$x=\exp [\mu-\sigma^2]$となることから確認できますね。
5. 混合正規分布
5-1. 確率密度関数
$$\begin{aligned} f(x) = \sum_{k=1}^K \pi_k \cdot \dfrac{1}{\sqrt{2 \pi \sigma_k^2}} \exp[- \dfrac{(x-\mu_k)^2}{2 \sigma_k^2}] ~~ (- \infty \lt x \lt \infty) \end{aligned}$$
(ただし、$\mu_k \in \mathbb{R}, \sigma_k^2 \gt 0, 0 \leqq \pi_k \leqq 1 ~~ {\small (k=1,\ldots,K)}, \sum_{k=1}^K \pi_k=1$)
5-2. (分布の)記号
特に決まったものはありませんが、下記の様によく表されます。
$$\begin{aligned} \sum_{k=1}^K \pi_k \N(\mu_k, \sigma_k^2) \end{aligned}$$
パラメータは$(3K)$個(”$\pi_k, \mu_k, \sigma_k^2 ~ {\small (k=1, \ldots, K)}$”)です。
5-3. グラフ
Fig5. 確率密度関数
出来上がった$0.3 \cdot \N(0, 1^2) + 0.7 \cdot \N(4, 2^2)$は$\N(0, 1^2), \N(4, 2^2)$から$30, 70$%を採用して足し合わせたものですね。
6. $\chi^2$分布
6-1. 確率密度関数
$$\begin{aligned} f(x) = \dfrac{1}{\Gamma(\frac{n}{2}) 2^{\frac{n}{2}}} x^{\frac{n}{2} – 1} e^{- \frac{x}{2}} ~~ (x \gt 0) \end{aligned}$$
(ただし、$n \in \mathbb{N}$)
6-2. (分布の)記号
$$\begin{aligned} \chi^2(n) \end{aligned}$$
記号はそのままですね。
パラメータは$1$つ(”$n$”)で、”$n$”は(分布の)自由度です。
6-3. グラフ
Fig6. 確率密度関数
$n$が$2$以下か$3$以上かでグラフの形状が異なることを確認してください。
これは$f(x)$における$x$の次数が$(\frac{n}{2}-1)$であり、$\frac{n}{2}-1=0 \Leftrightarrow n=2$を境にしてこの正負が変化するためです。
7. $t$分布
(注意)
<連続分布>で扱った「8. コーシー分布」は「7. $t$分布」の自由度$n=1$の場合なので、ここに含めます。
7-1. 確率密度関数
$$\begin{aligned} f(t) = \dfrac{\Gamma(\frac{n+1}{2})}{\sqrt{\pi n} \cdot \Gamma(\frac{n}{2})} (1 + \dfrac{t^2}{n})^{-\frac{n+1}{2}} ~~ (- \infty \lt t \lt \infty) \end{aligned}$$
(ただし、$n \gt 0$)
7-2. (分布の)記号
$$\begin{aligned} \t(n) \end{aligned}$$
記号はそのままですね。
パラメータは$1$つ(”$n$”)で、”$n$”は(分布の)自由度です。
7-3. グラフ
Fig7. 確率密度関数
$n=1$の場合はコーシー分布に相当し、その平均・分散は存在しません。また、$n$が大きくなるにつれて、形状が$\N(0,1)$のそれに近づきます。
(参照:<連続分布>:「8. コーシー分布」)
9. $F$分布
9-1. 確率密度関数
$$\begin{aligned} f(x) = \dfrac{\Gamma(\frac{n_1+n_2}{2})}{\Gamma(\frac{n_1}{2}) \Gamma(\frac{n_2}{2})} \cdot \dfrac{(\frac{n_1}{n_2})^{\frac{n_1}{2}} \cdot x^{\frac{n_1}{2}-1}}{(1 + \frac{n_1}{n_2} x)^{\frac{n_1+n_2}{2}}} ~~ (x \gt 0) \end{aligned}$$
(ただし、$n_1, n_2 \in \mathbb{N}$)
9-2. (分布の)記号
$$\begin{aligned} \F(n_1, n_2) \end{aligned}$$
記号はそのままですね。
パラメータは$2$つ(”$n_1, n_2$”)で、”$n_1,n_2$”は(分布の)自由度です。
9-3. グラフ
Fig9. 確率密度関数
$n_1$が$2$以下か$3$以上かでグラフの形状が異なることを確認してください。
これは$f(x)$における$x$の次数が$(\frac{n_1}{2}-1)$であり、$\frac{n_1}{2}-1=0 \Leftrightarrow n_1=2$を境にしてこの正負が変化するためです。
$n_2$については、値に応じた形状の変化は生じません。
10. 指数分布
10-1. 確率密度関数
$$\begin{aligned} f(x) = \lambda e^{- \lambda x} ~~ (x \gt 0) \end{aligned}$$
(ただし、$\lambda \gt 0$)
10-2. (分布の)記号
$$\begin{aligned} \Exp(\lambda) \end{aligned}$$
“Exp”は”Exponential(指数)”から由来しています。
パラメータは$1$つ(”$\lambda$”)です。
10-3. グラフ
Fig10. 確率密度関数
$\lambda$が小さいほど、平べったくなりますね。
$f(0)=\lambda$は$\lambda$が小さいほど小さくなり、曲線下面積は$1$と決まっていることからわかりますね。
11. ガンマ分布
11-1. 確率密度関数
$$\begin{aligned} f(x) = \dfrac{1}{\Gamma(a) b^a} x^{a-1} e^{-\frac{x}{b}} ~~ (x \gt 0) \end{aligned}$$
(ただし、$a \gt 0, b \gt 0$)
11-2. (分布の)記号
$$\begin{aligned} \Ga(a,b) \end{aligned}$$
“Ga”は”Gamma(ガンマ)”から由来しています。
パラメータは$2$つ(”$a,b$”)です。
“$a$”は「形状母数」と呼ばれるものでグラフの形状を変化させますが、”$b$”は「尺度母数」と呼ばれるものでグラフの形状を変化させません。
11-3. グラフ
Fig11_1. 確率密度関数($a$を変化)
$b=1$で固定して$a$を変化させています。
$a \leqq 1$か$a \gt 1$かでグラフの形状が異なることを確認してください。
これは$f(x)$における$x$の次数が$(a-1)$であり、$a-1=0 \Leftrightarrow a=1$を境にしてこの正負が変化するためです。
Fig11_2. 確率密度関数($b$を変化)
$a=2$で固定して$b$を変化させています。
$a$を変化させた場合には、$a=1$を境として形状が変化しましたが、$b$を変化させてもこのような形状の変化はおきません。($x, y$軸方向に拡大・縮小すれば同じグラフとなります)
12. ベータ分布
12-1. 確率密度関数
$$\begin{aligned} f(x) &= \dfrac{1}{B(a,b)} x^{a-1} (1-x)^{b – 1} ~~ (0 \lt x \lt 1) \\ &{\small (B(a,b) = \int_0^1 x^{a-1} (1-x)^{b-1} dx)} \end{aligned}$$
(ただし、$a \gt 0, b \gt 0$)
12-2. (分布の)記号
$$\begin{aligned} \Be(a, b) \end{aligned}$$
“Be”は”Beta(ベータ)”から由来しています。
パラメータは$2$つ(”$a,b$”)です。
“$a,b$”は「形状母数」と呼ばれるものでグラフの形状を変化させます。
12-3. グラフ
Fig12. 確率密度関数
$a,b$が変化するとグラフの形状はダイナミックに変化しますね。
ベータ分布は$0 \lt x \lt 1$で定義されること、$\Be(1,1)$は一様分布に相当することを確認してください。
(参照:<連続分布>:「12. ベータ分布」)
まとめ.
- 各連続分布に慣れるべく、①確率密度関数、②(分布の)記号、③グラフ、を確認した。