統計学

ポアソン分布と指数分布

$\gdef \vec#1{\boldsymbol{#1}} \\ \gdef \rank {\mathrm{rank}} \\ \gdef \det {\mathrm{det}} \\ \gdef \Bern {\mathrm{Bern}} \\ \gdef \Bin {\mathrm{Bin}} \\ \gdef \Mn {\mathrm{Mn}} \\ \gdef \Cov {\mathrm{Cov}} \\ \gdef \Po {\mathrm{Po}} \\ \gdef \HG {\mathrm{HG}} \\ \gdef \Geo {\mathrm{Geo}}\\ \gdef \N {\mathrm{N}} \\ \gdef \LN {\mathrm{LN}} \\ \gdef \U {\mathrm{U}} \\ \gdef \t {\mathrm{t}} \\ \gdef \F {\mathrm{F}} \\ \gdef \Exp {\mathrm{Exp}} \\ \gdef \Ga {\mathrm{Ga}} \\ \gdef \Be {\mathrm{Be}} \\ \gdef \NB {\mathrm{NB}}$

学習者

ポアソン分布と指数分布がテーマですか。
いまいち関連性が見えませんが。。

すたどく

ポアソン分布は「『(ランダムに発生する)イベント』が発生する回数」が従う分布でした*。
一方で、指数分布は「『(ランダムに発生する)イベント』が発生するまでの時間」が従う分布でした*。

学習者

イベントの発生について回数で視るか、時間で視るか、の違いということでしょうか?

すたどく

その通りです!なお、ポアソン分布、指数分布について忘れてしまっている場合には、<離散分布>:「4. ポアソン分布」と<連続分布>:「10. 指数分布」をざっと復習してください。

*:正確には、その様にモデリングされることが多いということです。

1. ポアソン分布と指数分布は表裏の関係

(ランダムに発生する)イベントの発生について、

となります。
($\Po(\lambda)$に従う確率変数の平均は$\lambda$、$\Exp(\lambda)$に従う確率変数の平均は$\frac{1}{\lambda}$でした)

つまり、視点を変えているだけで考えている内容は同じです。

すたどく

以下では、ポアソン分布から指数分布の導出、その逆、を確認してみます。

2. ポアソン分布から指数分布の導出

確率変数$X_t, T$を以下の様に定めます。

・$X_t$:(ランダムに発生する)イベントが$(0,t]$に発生する回数
・$T$:(ランダムに発生する)イベントが$1$回発生するまでの時間

この時$X_t \sim \Po(\lambda t)$と仮定すると、$X_t$の確率関数$p_t(x)$は、 $$\begin{aligned} p_t(x) = \dfrac{e^{- \lambda t} (\lambda t)^x}{x!} \end{aligned}$$です。


以下$T$の確率密度関数$g(t)$を導出します。
(導出された$g(t)$が指数分布の確率密度関数の形に一致すれば良いわけです)


イベントがある時間区間$(0, t]$において$x$回発生する確率は$p_t(x)$に他ならず、 $$\begin{aligned} \dfrac{e^{- \lambda t } (\lambda t)^x}{x!} ~~~~~ \mathrm{(A)} \end{aligned}$$となり、イベントがある時間区間$(0, t]$において少なくとも$1$回発生する確率$Pr\{ T \leqq t \}$は、
$$\begin{aligned} Pr \{ T \leqq t \} &= 1 – Pr\{ T \gt t \} \\[5px] &= 1 – ((A){\small に}x=0{\small を代入した値}) \\[5px] &= 1-e^{- \lambda t} \end{aligned}$$となります。


$Pr \{ T \leqq t \}$は$T$の分布関数に相当するので、
$$\begin{aligned} g(t) &= \dfrac{\partial}{\partial t} Pr \{ T \leqq t \} \\[5px] &= \lambda e^{- \lambda t} \end{aligned}$$となり、導出された$g(t)$が指数分布の確率密度関数の形に一致しました。

3. 指数分布からポアソン分布の導出

確率変数$T_i ~ {\small (i=1,2,\ldots)}, X$を以下の様に定めます。

・$T_i$:(ランダムに発生する)イベントについて、$(i-1)$回目から$i$回目までの時間
(ただし、$0$回目はカウント開始時点)
・$X$:(ランダムに発生する)イベントが$(0,1]$に発生する回数

この時$T_i \overset{i.i.d}\sim \Exp(\lambda) ~{\small (i=1, \ldots, x)}$と仮定し、以下$X$の確率関数$p(x)$を導出します。
(導出された$p(x)$がポアソン分布の確率関数の形に一致すれば良いわけです)


$Y = T_1 + \cdots + T_x$とおくと、$Y$は『イベントが$x$回発生するまでの時間』を表しており、

  • $\Exp(\lambda) = \Ga(1, \frac{1}{\lambda})$

  • $X_1 (\sim \Ga(a_1,b)), ~X_2 (\sim \Ga(a_2, b))$が互いに独立である時、$(X_1+X_2) \sim \Ga(a_1+a_2, b)$
    (参照:<連続分布>:「11. ガンマ分布」)

を考慮すると、
$$\begin{aligned} Y \sim \Ga(x, \frac{1}{\lambda}) \end{aligned}$$となります。


これと、事象$\{ Y \gt 1 \}$が事象$\{ X \leqq x-1 \}$(『イベントが単位時間あたり$x$回未満($(x-1)$回以下)発生する』)と一致することから、
$$\begin{aligned} Pr\{ X \leqq x-1 \} &= Pr\{ Y \gt 1 \} \\[10px] &= \int_1^{\infty} (\Ga(x, \frac{1}{\lambda}){\small の確率密度関数}) dy \\[10px] &= \int_1^{\infty} \dfrac{\lambda^x}{\Gamma(x)} y^{x-1}e^{-\lambda y} dy \\[10px] &= \int_1^{\infty} \dfrac{\lambda^{x-1}}{\Gamma(x)} y^{x-1} (- e^{-\lambda y})^{\prime} dy \\[10px] &= \left[ \dfrac{\lambda^{x-1}}{\Gamma(x)} y^{x-1} (- e^{-\lambda y}) \right]_1^{\infty} – \int_1^{\infty} \dfrac{\lambda^{x-1}}{\Gamma(x)} (x-1) y^{x-2} (- e^{-\lambda y}) dy \\[10px] &= \dfrac{\lambda^{x-1}}{\Gamma(x)} e^{-\lambda} + \int_1^{\infty} \dfrac{\lambda^{x-1}}{\Gamma(x-1)} y^{x-2}e^{-\lambda y} dy \\ &{\scriptsize (\Gamma(x)=(x-1)!、より、\dfrac{1}{\Gamma(x)}(x-1) = \dfrac{1}{\Gamma(x-1)})} \\[10px] &= \cdots \\[10px] &= \sum_{k=1}^x \dfrac{\lambda^{k-1}}{\Gamma(k)} e^{- \lambda} \\[10px] &= \sum_{k=1}^x \dfrac{\lambda^{k-1}}{(k-1)!} e^{- \lambda} \\ &{\scriptsize (\Gamma(x) = (x-1)!)} \\[10px] &= \sum_{k=0}^{x-1} \dfrac{\lambda^k e^{-\lambda}}{k!} \end{aligned}$$となります。


これより、$X$の分布関数に相当する$Pr\{ X \leqq x \}$は、
$$\begin{aligned} Pr\{ X \leqq x \} = \sum_{k=0}^{x} \dfrac{\lambda^k e^{-\lambda}}{k!} \end{aligned}$$となり、これはポアソン分布の分布関数の形に一致します。
よって、$p(x)$はポアソン分布の確率関数の形に一致します。

まとめ.

  • ポアソン分布と指数分布については、イベントの発生を回数で視るか時間で視るかの違いととらえることができ、表裏の関係にあると捉えることができる。
他の記事を参照されたい方はこちら

 サイトマップからお好きな記事をお探しください。