ポアソン分布露分け

二項分布は試行回数$n$の下での成功回数$s$の分布である。この確率質量関数で稀な出来事、つまり$p$が極めて零に近い出来事の分布を調べる。前提より確率は極めて小さいため累乗$p^{s}$は更に零に近づくと考えられる。そのまま零にすると \begin{align} f(s) &=\frac{n!}{s!(n-s)!} p^{s}(1-p)^{n-s}\notag\\ &\to \frac{n!}{s!(n-s)!} 0\cdot1\notag\\ &=0\notag \end{align} となってしまい計算できない。そこで制約として試行回数$n$が極めて大きいとし、そのため二項分布の期待値$\mu=np$は一定であるという条件を加える。確率質量関数を \begin{align} f(s) &=\frac{n!}{s!(n-s)!} \left(\frac{\mu}{n} \right) ^{s}\left(1-\frac{\mu}{n} \right)^{n-s} \notag\\ &=\frac{n(n-1)\cdots(n-s+1)}{s!} \frac{\mu^{s}}{n^{s}} \left(1-\frac{\mu}{n} \right)^{n-s} \notag\\ &=\frac{\mu^{s}}{s!} \left( \frac{n}{n} \frac{n-1}{n} \cdots \frac{n-s+1}{n} \right) \left(1-\frac{\mu}{n} \right)^{-s+n} \notag\\ &=\frac{\mu^{s}}{s!} \left(\frac{n}{n} \right)\left( \frac{n-1}{n} \right) \cdots \left( \frac{n-s+1}{n} \right) \left(1-\frac{\mu}{n} \right)^{-s} \left(1-\frac{\mu}{n} \right)^{n} \notag\\ &=\frac{\mu^{s}}{s!} 1 \left( 1- \frac{1}{n} \right) \cdots \left(1- \frac{s-1}{n} \right) \left(1-\frac{\mu}{n} \right)^{-s} \left(1-\frac{\mu}{n} \right)^{n} \notag \end{align} と書き換え、$s$を固定して極限をとる。 \[\left( 1- \frac{1}{n} \right) \cdots \left(1- \frac{s-1}{n} \right) \]の部分は$n\rightarrow \infty$で \[\left( 1- 0\right) \cdots \left(1- 0\right)=1 \] となる。同じように$\left(1-\frac{\mu}{n} \right)^{-s} \notag$も$1$となる。$\left(1-\frac{\mu}{n} \right)^{n}$の部分は$1/n'=-\mu/n$なる$n'$を使うことで \[ \left(1-\frac{\mu}{n} \right)^{n}=\left( \left(1+\frac{1}{n'}\right)^{n'} \right)^{-\mu} \] と書き換えられる。これは自然対数の底$\mathrm{e}$の定義 \[ \lim_{x \rightarrow \pm\infty} \left(1+\frac{1}{x} \right)^{x} =\mathrm{e} \] を使うことで、$n'\rightarrow -\infty$のとき \[ \left(1-\frac{\mu}{n} \right)^{n}= \left( \left(1+\frac{1}{n'}\right)^{n'} \right)^{-\mu} \rightarrow \exp\left( -\mu \right) \] となる。このことから$n$が無限と見做せるような場合では \[ \lim_{n \rightarrow \infty} \frac{\mu^{s}}{s!} 1 \left( 1- \frac{1}{n} \right) \cdots \left(1- \frac{s-1}{n} \right) \left(1-\frac{\mu}{n} \right)^{-s} \left(1-\frac{\mu}{n} \right)^{n} =\frac{\mu^{s}}{s!} \exp(-\mu) \] と計算できる。以上の計算結果より稀な事象の確率質量関数を \[ \mathrm{Po}(s|\mu)=\frac{\mu^{s}}{s!}\exp(-\mu) \] とする。この確率分布は仏国の数学者Poissonに因んでポアソン分布という。Poissonの発音は仏語でポワッソン、英語でポワソーンが近いが、日本語の音訳ではポアソンが多い。

この総和が一であることは指数の展開式から示せる。これは \[ \exp(x) =\sum_{n=0}^{\infty} \frac{x^{n}}{n!} = \frac{x^{0}}{0!}+\frac{x^{1}}{1!}+\frac{x^{2}}{2!}+\cdots \] であるため、総和は次のように書ける。 \begin{align} \sum_{s=0}^{\infty} f(s) &=\sum_{s=0}^{\infty} \frac{\mu^{s}}{s!}\exp(-\mu) \notag\\ &=\exp(\mu)\exp(-\mu) \notag\\ &=1 \notag \end{align} となる。期待値は \begin{align} \mathrm{E}[S] &=\sum_{s=0}^{\infty} s \frac{\mu^{s}}{s!}\exp(-\mu) \notag\\ &=0+\sum_{s=1}^{\infty} \mu \frac{\mu^{s-1}}{(s-1)!}\exp(-\mu) \notag\\ &=\mu \sum_{s'=0}^{\infty} \frac{\mu^{s'}}{s'!}\exp(-\mu) \notag\\ &=\mu\notag \end{align} となり、最初の制約条件と等しい。階乗積率を求める。 \begin{align} E[S(S-1)] &= \sum_{s=0}^{\infty} s(s-1) \frac{\mu^{s}}{s!}\exp(-\mu) \notag\\ &= \sum_{s=2}^{\infty} \frac{ \mu^{s-2} }{(s-2)! } \mu^{2} \exp(-\mu) \notag\\ &= \mu^{2}. \notag \end{align} これを用いると分散は \begin{align} \mathrm{Var}[S] &= E[S(S-1)]+E[S]-\left(E[S]\right)^{2} \notag\\ &=\mu^{2}+\mu-\mu^{2} \notag\\ &=\mu\notag \end{align} となる。これまでの結果は二項分布の期待値 \[ \mathrm{E}_{ \mathrm{Bin}}[S]=np=\mu =\mathrm{E}_{ \mathrm{Po}}[S] \] と同じであり、二項分布の分散は \[ \mathrm{Var}_{ \mathrm{Bin}}[S]=np(1-p)=np-np^{2}=\mu-\mu p \] であり、$p\to 0$のとき \[ \mathrm{Var}_{ \mathrm{Bin}}[S] \to \mu = \mathrm{Var}_{ \mathrm{Po}}[S] \] となり、ポアソン分布の分散と見做せる。

確率母関数は \[ G(t) = E[t^{S}] = \sum_{s=0}^{\infty} \frac{ (\mu t)^{s} }{ s! } \exp(-\mu) = \exp( \mu t -\mu) \] と計算でき、これを微分すると \[ \frac{\mathrm{d}}{\mathrm{d} t} G(t) = E[S t^{S-1}] = \mu \exp( \mu t -\mu) \] となるため \[ \left. \frac{\mathrm{d}}{\mathrm{d} t} G(t) \right|_{t=1} = E[S ] = \mu \] となる。二階微分は \[ \frac{ \mathrm{d}^{2} }{ \mathrm{d} t^{2} } G(t) = E[S (S-1)t^{S-2}] = \mu^{2} \exp( \mu t -\mu) \] となるため \[ \left. \frac{\mathrm{d}^{2} }{\mathrm{d} t^{2} } G(t) \right|_{t=1} = E[S(S-1) ] = \mu^{2} \] となる。どちらもすでに得た結果と一致する。

二項分布の拡張として多項分布がある。同じようにポアソン分布にも多変量ポアソン分布がある。後日加筆する。