負の二項分布露分け

幾何分布では成功回数が一回となったとき終了とする確率分布関数であった。幾何分布の拡張として試行回数$n$が確率変数であり、成功回数が$s$のとき終了とする確率分布がある。これを求める。成功確率は幾何分布と同じく$p$とする。すると失敗確率は$q=1-p$となる。成功は$s$回あり、失敗は$n-s$回ある。このことから確率質量関数は$p^{s} q^{n-s}$となる。他に考慮すべきこととして成功と失敗の順番がある。全体として$n$回の試行回数があり、最後の成功は$n$回目であり、これは最後の試行でもある。それ以外に順番に制約は無い。このような順序の組み合わせは全体で$n-1$個あるものの中から$s-1$個を選ぶ組み合わせである。これは$\binom{n-1}{s-1}$である。故に確率質量関数は$p^{s-1}$、$ q^{(n-1)-(s-1)}$を$\binom{n-1}{s-1}$の組み合わせで順序を考慮したものに$p$を掛けたものである。つまり \[ \mathrm{NBin}(n|p,s) =\binom{n-1}{s-1} p^{s-1} q^{(n-1)-(s-1)} \cdot p =\binom{n-1}{s-1} p^{s} q^{n-s} \] である。ここで失敗回数を$l=n-s$として定義すると \begin{align} \mathrm{NBin}(n|p,s) & = \frac{(n-1)!}{((n-1)-(s-1))!(s-1)!} p^{s} q^{n-s} \notag\\ & = \frac{(l+s-1)!}{l!(s-1)!} p^{s} q^{l} \notag\\ & = \binom{l+s-1}{l} p^{s} q^{l} \notag\\ & = {}_{l+s-1}\mathrm{C}_{l}p^{s} q^{l} \notag\\ & = {}_{s}\mathrm{H}_{l}p^{s} q^{l} \notag \end{align} となる。重複組み合わせ$\mathrm{H}$は文字通り重複を許した組み合わせである。この場合では一回目の成功の前と、一回目と二回目の成功の間と、二回目と三回目の成功の間と、等々、 $s-1$回目と$s$回目の成功の間との計$s$個の中で重複を許して選び失敗する回数を割り振る関数である。上の式から分かるように \[ {}_{s}\mathrm{H}_{l} =\frac{(s+l-1)\cdots (s+1)s}{l!} \] である。これは$1=(-1)^{2l}$を使い \[ {}_{s}\mathrm{H}_{l} =(-1)^{l}\frac{(-s)(-s-1)\cdots(-s-l+1) }{l!} = (-1)^{l} \binom{-s}{l} \] とも書き換えられる。$\binom{-s}{l}$は負の二項係数である。よって \[ \mathrm{NBin}(l|p,s) = \binom{l+s-1}{l} p^{s} q^{l} = \binom{-s}{l} p^{s} (-q)^{l} \] であり、負の二項定理との関連から負の二項分布と呼ばれる。

別の求め方としてポアソン分布 \[ \mathrm{Po} (l|\lambda)=\frac{\lambda^{l} }{ l!} \exp(-\lambda),\ \mathrm{E_{Po}}[L]=\lambda,\ \mathrm{Var_{Po}}[L]=\lambda \] の重要な係数である$\lambda$が尺度母数を$\frac{q}{p}$とし形状母数を$s$とするガンマ分布 \[ \mathrm{Ga} \left(\lambda \Big|s,\frac{q}{p} \right)= \frac{\lambda^{s-1}}{ \Gamma(s)} \left(\frac{p}{q} \right)^{s} \exp \left(-\frac{p}{q}\lambda \right),\ \mathrm{E_{Ga}}[\Lambda]=s \frac{q}{p},\ \mathrm{Var_{Ga}}[\Lambda]= s\frac{q^{2}}{p^{2}} \] に従うとして、ポアソン分布の確率質量関数を$\mathrm{Ga}(\lambda)$を重みとする重み付き平均をとると負の二項分布の確率質量関数になる。 \begin{align} \int_{0}^{\infty} \mathrm{Po} (l|\lambda) \mathrm{Ga}(\lambda) \mathrm{d} \lambda &= \frac{1}{l! \Gamma(s)} \left(\frac{p}{q}\right)^{s} \int_{0}^{\infty} \lambda^{s+l-1} \exp \left(-\frac{p+q}{q}\lambda \right) \mathrm{d}\lambda \notag\\ &= \frac{1}{l! \Gamma(s)} \left(\frac{p}{q}\right)^{s} \int_{0}^{\infty} \left( \frac{ q }{p+q}u \right)^{s+l-1} \exp \left(-u \right) \frac{ q }{ p+q } \mathrm{d}u \notag\\ &= \frac{\Gamma(s+l)}{l! \Gamma(s)} \frac{p^{s} q^{l}}{(p+q)^{s+l} } \notag\\ &= \binom{l+s-1}{l} p^{s} q^{l} \notag\\ &=\mathrm{NBin}(l|p,s). \notag \end{align}

負の二項分布、ポアッソン分布、ガンマ分布の三者の間の関係の意味を考える。後述するように負の二項分布の期待値と分散とは \[ \mathrm{E_{NBin}}[L]=s\frac{1-p}{p}=s\frac{q}{p},\ \mathrm{Var_{NBin}}[L]=s\frac{1-p}{p^{2}}=s\frac{q}{p^{2}} \] である。期待値$sq/p$を$\lambda$と記すと分散は \[ \mathrm{Var_{NBin}}[L]=\lambda+\frac{\lambda^{2}}{s} \] と書ける。$s$が無限大になるとき分散は \[ \lim_{l \to \infty} \mathrm{Var_{NBin}}[L] =\lambda =\mathrm{Var_{ Po }}[L] \] となる。確率質量関数については \[ \lambda=s\frac{q}{p},\ p+q=1 \] より \[ p=\frac{s}{s+\lambda},\ q = \frac{\lambda}{s+\lambda} \] であるため \begin{align} \mathrm{NBin}(l|p,s) &= \binom{l+s-1}{l}q^{l} p^{s} \notag\\ &= \frac{(s+l-1)(s+l-2)\cdots(s+1)s}{l!} \left(\frac{\lambda}{s+\lambda}\right)^{l} \left(\frac{s}{s+\lambda}\right)^{s} \notag\\ &= \frac{\lambda^{l}}{l!} \frac{s+l-1}{s+\lambda} \frac{s+l-2}{s+\lambda} \cdots \frac{s+1}{s+\lambda} \frac{s}{s+\lambda} \left(1+\frac{\lambda}{s} \right)^{-s} \notag\\ &= \frac{\lambda^{l} }{ l! } \frac{1+\frac{l-1}{s} }{ 1+\frac{\lambda}{s} } \frac{1+\frac{l-2}{s} }{ 1+\frac{\lambda}{s} } \cdots \frac{1+\frac{1}{s} }{ 1+\frac{\lambda}{s} } \frac{1}{1+\frac{\lambda}{s} } \left\{\left(1+\frac{1}{s'} \right)^{s'}\right\}^{-\lambda} \notag\\ &\to \frac{\lambda^{l} }{l!}\exp(-\lambda) \notag \end{align} となる。途中$s'=s/\lambda$とした。これは試行毎に不定な終了条件$s$が無限大で定まるため、確率変数の揺らぎを表す分散が一定になると考えられる。

逆にポアソン分布の分散から負の二項分布の分散を導く。確率変数$l$がポアソン分布に従うとき$l \sim \mathrm{Po}(\lambda)$、その分散は \[ \mathrm{Var_{Po}}[L]=\lambda \] となる。全分散の公式 \[ \mathrm{Var}_{X}[X] = \mathrm{E}_{Y}[ \mathrm{Var}_{ X | Y }[X| Y ] ]+ \mathrm{Var}_{ Y }[ \mathrm{E}_{ X| Y}[ X | Y] ] \] は二変数$X,Y$が独立であれば \begin{align} \mathrm{E}_{ X| Y}[ X | Y] &= \sum_{x} x f_{X|Y}(x) \notag\\ &= \sum_{x} x \frac{ f_{X, Y}(x,y) }{ f_{Y}(y) } \notag\\ &\Rightarrow \sum_{x} x \frac{ f_{X}(x) f_{Y}(y) }{f_{Y}(y) } \notag\\ &= \sum_{x} x f_{X}(x) \notag\\ &= \mathrm{E}_{ X}[ X ] \notag \end{align} となるため \begin{align} \mathrm{Var}_{ X | Y }[X| Y ] &=\sum_{x} \Big(x - \mathrm{E}_{ X| Y}[ X | Y] \Big)^{2} f_{X}(x) \notag\\ &\Rightarrow \sum_{x} \Big(x - \mathrm{E}_{ X}[ X ] \Big)^{2} f_{X}(x) \notag\\ &= \mathrm{Var}_{ X }[X] \notag \end{align} となり \begin{align} \mathrm{Var}_{ Y }[ \mathrm{E}_{ X| Y}[ X | Y] ] &=\sum_{x} \Big( \mathrm{E}_{ X| Y}[ X | Y] - \mathrm{E}_{Y}[\mathrm{E}_{ X| Y}[ X | Y]] \Big)^{2} f_{Y}(y) \notag\\ &\Rightarrow \sum_{x} \Big( \mathrm{E}_{ X}[ X ] - \mathrm{E}_{Y}[\mathrm{E}_{ X}[ X ]] \Big)^{2} f_{Y}(y) \notag\\ &= \sum_{x} \Big( \mathrm{E}_{ X}[ X ] - \mathrm{E}_{ X}[ X ] \Big)^{2} f_{Y}(y) \notag\\ &= 0 \notag \end{align} となる。当然の帰結として \[ \mathrm{Var}_{X}[X] = \mathrm{Var}_{X}[X] \] となる。よってポアソン分布の確率変数が$\lambda$と独立であれば分散は変わらない。しかし確率変数は \begin{align} & l | \lambda \sim \mathrm{Po}(\lambda) \notag\\ & \lambda \sim \mathrm{Ga}\left(s,\frac{q}{p}\right) \notag \end{align} のように従うとすると全分散の公式 \[ \mathrm{Var}_{X}[X] = \mathrm{E}_{Y}[\mathrm{Var}_{ X | Y }[X| Y ] ]+ \mathrm{Var}_{ Y }[\mathrm{E}_{ X| Y}[ X | Y]] \] は \[ \mathrm{Var}_{L \sim \mathrm{Po}}[L] = \mathrm{E_{\Lambda \sim Ga}}[\mathrm{Var_{ L| \Lambda \sim Po}}[L|\Lambda]]+ \mathrm{Var_{\Lambda \sim Ga}}[\mathrm{E_{ L|\Lambda \sim Po}}[L|\Lambda]] \] と書ける。ポアソン分布は期待値も分散も$\lambda$であるため \begin{align} \mathrm{Var}_{L \sim \mathrm{Po}}[L] &= \mathrm{E_{\Lambda \sim Ga}}[\Lambda] + \mathrm{Var_{\Lambda \sim Ga}}[\Lambda] \notag\\ &= s \frac{q}{p} + s \frac{q^{2}}{p^{2}} \notag\\ &= \lambda+\frac{\lambda^{2}}{s} \notag \end{align} となる。この右辺は負の二項分布の分散である。第一項は$\lambda$に依存しない場合のポアソン分布の分散であり、$p=\frac{s}{s+\lambda},\ q = \frac{\lambda}{s+\lambda}$よりガンマ分布の分散は$\mathrm{Var_{Ga}}[\Lambda]= s\frac{q^{2}}{p^{2}}=\frac{\lambda^{2}}{s}$となるため第二項はガンマ分布の分散である。よって \[ \mathrm{Var_{NBin}}[L]= \mathrm{Var_{Po}}[L]+ \mathrm{Var_{Ga}}[\Lambda] \] と書ける。つまり通常のポアソン分布にガンマ分布に由来する揺らぎを与えると負の二項分布になり、負の二項分布の揺らぎを消すとポアソン分布になると考えられる。以上のガンマ分布とポアソン分布との関係から負の二項分布はガンマ・ポアソン分布とも呼ばれる。導出法は他にも数多くありHilbeは著書Negative Binominal Regressionに於いてBoswellとPatilが十三種の導出法を特定し他の統計学者はさらに多くの導出法があると主張しているとし、恐らくこれほど多様な起源のある確率分布は他に無いだろうともしている。

　全ての導出法を記載する予定はないがもう一つパスカルの法則を用いた確率質量関数の導出法を示す。当たり外れの入った袋から取り出すとして$j-1$回当たりが出て$k$回外れ出る状況から当たりが出る場合と$j$回当たりが出て$k-1$回外れが出る状況から外れが出る場合との和が$f(j,k)$になる。このような \[ f(j,k)=pf(j-1,k)+qf(j,k-1) \] という性質を持つ確率質量関数を求める。境界条件として \[ f(1,k)=pq^{k},\ f(j,0)=p^{j} \] を設定する。これは復元抽出であれば当たりが出る確率$p$も外れが出る確率$q$も一定であるため確率質量関数を$f(j,k)=g(j,k)p^{j}q^{k}$と分解できるとする。上の式は \[ g(j,k)p^{j}q^{k} = \Big\{g(j-1,k) +g(j,k-1) \Big\}p^{j}q^{k} \] と書き換えられるため \[ g(j,k) = g(j-1,k) +g(j,k-1) \] である。この等式を満たす関数$g$として \[ g(j,k)=\binom{j+k-1}{k} \] を仮定すれば、パスカルの法則より \begin{align} \text{右辺} &= g(j-1,k) +g(j,k-1) \notag\\ &= \binom{j-1+k-1}{k} + \binom{j+k-1-1}{k-1} \notag\\ &= \binom{j+k-2}{k}+\binom{j+k-2}{k-1} \notag\\ &= \binom{j+k-1}{k} \notag\\ &= g(j,k)\notag\\ &= \text{左辺}\notag \end{align} となるため等式は成り立つ。よって$g(j,k)=\binom{j+k-1}{k}$という仮定は正しいだろう。すると \[ f(j,k)=\binom{j+k-1}{ k }p^{j}q^{k} \] となる。続いて幾何分布との繋がりを見る。 \[ f(j,k) = p f(j-1,k) + q f(j,k-1) \] の右辺第二項は \[ q f(j,k-1) = q \binom{j+k-1-1}{k-1} p^{j}q^{k-1} = \frac{k}{j+k-1} \binom{j+k-1}{k} p^{j} q^{k} \] と書き換えられるため \begin{align} \left\{1-\frac{ k }{ j + k - 1 } \right\}f(j,k) &=pf(j-1,k) \notag\\ f(j,k)&=\frac{ j+k-1}{j-1} p f(j-1,k) \notag \end{align} を得る。繰り返すと \[ f(j,k) = \frac{ j+k-1}{j-1}\frac{ j+k-2}{j-2}\cdots\frac{ k + 1 }{1}p^{ j-1} f(1,k) \] となる。境界条件$f(1,k)$は幾何分布に他ならないため$f(1,k)=q^{k}p$である。そのため \[ f(j,k) =\binom{j+k-1}{j-1} p^{j} q^{k} \] となる。或いは$f(j,k) = p f(j-1,k) + q f(j,k-1)$の右辺第一項を \[ pf(j-1,k) =p\binom{j-1+k-1}{k} p^{j-1}q^{k} =\frac{j-1}{j+k-1} f(j,k) \] と書き換え \[ f(j,k)=\frac{j+k-1}{k} qf(j,k-1) \] を得る。これを繰り返すと \[ f(j,k)= \frac{j+k-1}{k} \frac{j+k-2}{k-1} \cdots \frac{j}{1} q^{k} f(j,0) \] となる。もう一方の境界条件$f(j,0)=p^{j}$より \[ f(j,k)=\binom{j+k-1}{k} p^{j} q^{k} \] となる。

確率質量関数の総和が１であることを確かめる。まず試行回数$n$で総和を取る。下限は、全てで成功する試行回数$n$と成功回数$s$とが一致する場合である。上限はいつまでも成功回数が既定の回数に達しない場合である。これを$n=\infty$とする。つまり確率質量関数の総和は \[ 1=\sum_{n=s}^{\infty} f_{N}(n) \] であることを示す。右辺は \begin{align} \text{右辺} &=\sum_{n=s}^{\infty} \binom{n-1}{s-1} p^{s} q^{n-s}\notag\\ &=\sum_{l=0}^{\infty} \binom{l+s-1}{l} p^{s} q^{l}\notag\\ &=p^{s} \sum_{l=0}^{\infty} \binom{l+s-1}{l} q^{l}\notag \end{align} と書き変えられる。負の二項定理より \begin{align} \sum_{l=0}^{\infty} \binom{l+s-1}{l} 1^{-s-l}q^{l} &=\sum_{l=0}^{\infty} \binom{-s}{l} 1^{-s-l} (-q)^{l}\notag\\ &=(1-q)^{-s}\notag\\ &=p^{-s}\notag \end{align} となる。そのため右辺は \begin{align} \text{右辺} &=p^{s} p^{-s}=1\notag \end{align} となり、等号が成り立つことが確かめられた。

次に期待値を求める。 \[ \mathrm{E}[N]=\sum_{n=s}^{\infty} n f_{N}(n) \] が期待値の式である。$n$についての総和を$l=n-s$で書き換えると \begin{align} \mathrm{E}[N] &=\sum_{n=s}^{\infty} n f_{N}(n) \notag\\ &=\sum_{l=0}^{\infty}(s+l) \binom{l+s-1} {l} p^{s} q^{l}\notag\\ &= s\sum_{l=0}^{\infty} \binom{l+s-1} {l} p^{s} q^{l}+ \sum_{l=0}^{\infty}l \binom{l+s-1} {l} p^{s} q^{l} \notag\\ &= s\sum_{l=0}^{\infty}f_{L}(l)+\sum_{l=0}^{\infty} l f_{L}(l) \notag \end{align} となる。この第一項の総和の部分は確率の公理により１である。そのため第一項は$s$である。第二項は失敗回数の期待値であり \begin{align} \mathrm{E}[L] &=\sum_{l=0}^{\infty} l f_{L}(l) \notag\\ &=\sum_{l=0}^{\infty}l \binom{l+s-1} {l} p^{s} q^{l} \notag\\ &=0+\sum_{l=1}^{\infty}l \frac{(l+s-1)!}{l!(s-1)!} p^{s} q^{l} \notag\\ &=s \frac{q}{p} \sum_{l=1}^{\infty} \frac{(l+s-1)!}{(l-1)!s!} p^{s+1} q^{l-1} \notag \end{align} と書け、$l-1=l',s+1=s'$とすると \[ s \frac{q}{p} \sum_{l'=0}^{\infty} \frac{(l'+s'-1)!}{l'!(s'-1)!} p^{s'} q^{l'} \] となる。この総和は、先程の確率質量関数の総和の添え字を変えたものに他ならないため$1$である。そのため第二項は$sq/p$となる。期待値は \begin{align} \mathrm{E}[N] &=s+\mathrm{E}[L] \notag\\ &=s+s \frac{q}{p}\notag\\ &=s+s\frac{1}{p}-s\notag\\ &=s\frac{1}{p}\notag \end{align} である。この式は \[ \text{試行回数$n$の期待値}=s+\text{失敗回数$l$の期待値} \] を表し幾何分布の$\mathrm{E}[N]=\mathrm{E}[L]+1$に対応する。これは$n=s+l$の期待値を直接求めても得られる。この式の確率変数ではない$s$についての期待値を求めることができないことは、負の二項分布の終了条件が既定の回数だけ成功すること、換言すると$s$は定数であることから理解できる。付言しておくと定数$s$の期待値は \[ \mathrm{E}[s]=\sum_{n=s}^{\infty} s f_{N}(n)=s \sum_{n=s}^{\infty} f_{N}(n)=s \cdot 1 =s \] のように元の定数$s$になる。また失敗する確率$q$は$1-p$であるため、失敗回数の期待値は \begin{align} \mathrm{E}[L] &=\mathrm{E}[N]-s \notag\\ &=s\frac{1}{p}-s \notag\\ &=s\frac{1-p}{p} \notag\\ &=s\frac{q}{p} \notag \end{align} となる。統計検定の教科書を読むに、統計検定の負の二項分布は失敗回数に着目している。流儀によっては試行回数に着目する方を負の二項分布としているものの他に所謂NB1と呼ばれるものもあるため注意が必要である。

試行回数$n$の分散を求める。通常、分散は二乗の期待値を求めてから$\mathrm{Var}[N]=\mathrm{E}[N^{2}]-\left(\mathrm{E}[N]\right)^{2}$から求める方法と、階差の期待値を用いて$\mathrm{Var}[N]=\mathrm{E}[N(N-1)]+\mathrm{E}[N]-\left(\mathrm{E}[N]\right)^{2}$から求める方法とがある。階差の計算は二項分布のときに利用した \[ s(s-1) \binom{n}{s} = \frac{s(s-1) \cdot n!}{s!(n-s)!} = \frac{n(n-1) \cdot (n-2)!}{(s-2)!((n-2)-(s-2))!} =n(n-1) \binom{n-2}{s-2} \] という手法は \[ n(n-1)\binom{n-1}{s-1}=n(n-1) \frac{(n-1)!}{(s-1)!( (n-1) - (s-1) )!} \] となるため利用できない。そのため確率母関数を使わずに下降の階乗積率は求められない。これは二乗の期待値から間接的に$\mathrm{E}[N(N-1)]=\mathrm{E}[N^{2}]-\mathrm{E}[N]$として求められるが、そもそも二乗の期待値はこの確率質量関数では直接に求めることは煩雑である。そこで上昇の階乗積率を使う。これは \[ (n+1)n \binom{n-1}{s-1} = \frac{(n+1)n \cdot (n-1)!}{(s-1)! ((n-1-(s-1))!} = \frac{(s+1)s \cdot (n+1)!}{(s+1)! ((n+1)-(s+1))!} = (s+1)s \binom{n+1}{s+1} \] とすることで求められる。このことから$\mathrm{Var}[N]=\mathrm{E}[N(N+1)]-\mathrm{E}[N]-\left(\mathrm{E}[N]\right)^{2}$と求められる。まず上昇の階乗積率から求め、分散を求める。

上昇の階乗積率を求める。これは \begin{align} \mathrm{E}[(N+1)N] &= \sum_{n=s}^{\infty} (n+1)n \binom{n-1}{s-1} p^{s}q^{n-s} \notag\\ &= (s+1)sp^{s} \left\{ \sum_{l=0}^{\infty} \binom{l+s+2-1}{l} q^{l} \right\} \notag\\ &= (s^{2}+s)p^{s} (1-q)^{-(s+2)} \notag\\ &= \frac{s^{2}+s}{p^{2}} \notag \end{align} と求まる。故に分散は \begin{align} \mathrm{Var}[N] &= \mathrm{E}[(N+1)N]-\mathrm{E}[N]- \left(\mathrm{E}[N]\right)^{2} \notag\\ &= \frac{s^{2}+s}{p^{2}}-\frac{s}{p} -\left(\frac{s}{p}\right)^{2} \notag\\ &= s\frac{1-p}{p^{2}} \notag\\ &= \frac{sq}{p^{2}} \notag \end{align} となる。

失敗回数の分散は$f_{L}(l)=f_{N}(n),\ \mu_{L}=\mu_{N}-s, l=n-s$より \begin{align} \mathrm{Var}[L] &=\sum_{l=0}^{\infty} (l-\mu_{L})^{2} f_{L}(l) \notag\\ &=\sum_{n=s}^{\infty} (n+s-(\mu_{N}+s))^{2} f_{L}(l) \notag\\ &=\sum_{n=s}^{\infty} (n-\mu_{N})^{2} f_{N}(n) \notag\\ &=\mathrm{Var}[N]　\notag\\ &=\frac{sq}{p^{2}} \notag \end{align} と試行回数の分散と等しいことが分かる。

試行回数$n$について確率母関数を求める。 \begin{align} G_{N}(t) &=\mathrm{E}[t^{N}] \notag\\ &=\sum_{n=s}^{\infty} t^{n} f_{N}(n) \notag\\ &=\sum_{n=s}^{\infty} t^{n} \binom{n-1}{s-1} p^{s}q^{n-s} \notag\\ &=\sum_{l=0}^{\infty} \binom{s+l-1}{s-1} (pt)^{s} (qt)^{l} \notag\\ &= (pt)^{s} \sum_{l=0}^{\infty} \binom{s+l-1}{l} (qt)^{l} \notag\\ &=(pt)^{s} (1-tq)^{-s} \notag\\ &=\left( \frac{pt}{1-qt} \right)^{s}. \notag \end{align} これを微分すると \begin{align} \frac{\mathrm{d}}{\mathrm{d}t} G_{N}(t) &=\mathrm{E}[N t^{N-1}] \notag\\ &=s \left( \frac{p(1-qt)-pt(-q)}{(1-qt)^{2}} \right) \left( \frac{pt}{1-qt} \right)^{s-1} \notag\\ &=s \frac{p}{(1-qt)^{2}} \left( \frac{1-qt}{pt} \right) \left( \frac{pt}{1-qt} \right)^{s} \notag\\ &= \frac{s}{t(1-qt)} G_{N}(t) \notag \end{align} となり、$t=1$のとき \[ G_{N}(1)=\mathrm{E}[1^{N}]=\sum_{n} f_{N}(n)=1 \] であることから \begin{align} \left.\frac{\mathrm{d}}{\mathrm{d}t} G_{N}(t) \right|_{t=1} &=\mathrm{E}[N] \notag\\ &= \frac{s}{1(1-q)}\cdot 1 \notag\\ &= \frac{s}{p}\notag \end{align} となる。これは既に求めた試行回数の期待値と一致する。ここで \begin{align} \frac{\mathrm{d}}{\mathrm{d}t} \frac{s}{t(1-qt)} &= \frac{\mathrm{d}}{\mathrm{d}t} s(t-qt^{2})^{-1} \notag\\ &= s(-1)(1-2qt)(t-qt^2)^{-2} \notag\\ &= s\frac{-1+2qt-q^{2}t^{2}+q^{2}t^{2}}{(t-qt^{2})^{2}} \notag\\ &= s\frac{-(1-qt)^{2}+q^{2}t^{2}}{(t(1-qt))^{2}} \notag\\ &= s\left(-\frac{1}{t^{2}}+\frac{q^{2}}{(1-qt)^{2}} \right) \notag \end{align} となるため二階微分は \begin{align} \frac{\mathrm{d}^2}{\mathrm{d}t^2}G_{N}(t) &= \mathrm{E}[N(N-1)t^{N-2}] \notag\\ &= \frac{\mathrm{d}}{\mathrm{d}t}\left\{ \frac{s}{t(1-qt)} \right\}G_{N}(t) + \frac{s}{t(1-qt)} \frac{\mathrm{d}}{\mathrm{d}t}G_{N}(t) \notag\\ &= s\left\{ \left(-\frac{1}{t^{2}}+\frac{q^{2}}{(1-qt)^{2}} \right)G_{N}(t)+ \left(\frac{1}{t}+\frac{q}{1-qt}\right) \frac{\mathrm{d}}{\mathrm{d}t} G_{N}(t) \right\} \notag\\ &= s\left\{ -\frac{1}{t^{2}}+\frac{q^{2}}{(1-qt)^{2}}+s\left(\frac{1}{t}+\frac{q}{1-qt}\right)^{2} \right\}G_{N}(t) \notag \end{align} となるため二階の階乗積率は \begin{align} \left. \frac{\mathrm{d}^2}{\mathrm{d}t^2}G_{N}(t) \right|_{t=1} &= \mathrm{E}[N(N-1)] \notag\\ &= s\left\{ -\frac{1}{1}+\frac{q^{2}}{p^{2}}+s\left(\frac{1}{1}+\frac{q}{1-q}\right)^{2} \right\} \cdot 1 \notag\\ &= s\left\{ \frac{-p^2+q^2}{p^2}+s\left(\frac{p+q}{p}\right)^{2} \right\} \notag\\ &= \frac{s(1-2p)+s^{2}}{p^2} \notag \end{align} である。これを検証する。$\mathrm{E}[N(N-1)]=\mathrm{E}[(N+1)N]-2\mathrm{E}[N]$であり、代入すると \begin{align} \mathrm{E}[N(N-1)] &= \mathrm{E}[(N+1)N]-2\mathrm{E}[N] \notag\\ &= \frac{s^{2}+s}{p^{2}}-2\frac{s}{p} \notag\\ &= \frac{s(1-2p)+s^{2}}{p^{2}} \notag \end{align} となる。これは確率母関数で求めた結果と一致する。

次は失敗回数について確率母関数を求める。 \begin{align} G_{L}(t) &=\mathrm{E}[t^{L}] \notag\\ &=\sum_{l=0}^{\infty} t^{l} f_{L}(l) \notag\\ &=p^{s} \sum_{l=0}^{\infty} \binom{l+s-1}{l} (qt)^{l} \notag\\ &=p^{s} (1-qt)^{-s} \notag\\ &=\left( \frac{p}{1-qt} \right)^{s} .\notag \end{align} これを微分すると \begin{align} \frac{\mathrm{d}}{\mathrm{d}t} G_{L}(t) &=\mathrm{E}[Lt^{L-1}] \notag\\ &= \frac{qs p^{s}}{(1-qt)^{s+1}} \notag\\ &= \frac{sq}{1-qt} \left( \frac{p}{1-qt} \right)^{s} \notag\\ &= \frac{sq}{1-qt} G_{L}(t) \notag \end{align} となり、$t=1$のとき \begin{align} \left. \frac{\mathrm{d}}{\mathrm{d}t} G_{L}(t) \right|_{t=1} &=\mathrm{E}[L] \notag\\ &= \frac{sq}{1(1-q)} \left( \frac{p}{1-q} \right)^{s} \notag\\ &= \frac{sq}{p}\notag \end{align} となる。二階微分では \begin{align} \frac{\mathrm{d}^{2}}{\mathrm{d}t^{2}} G_{L}(t) &=\mathrm{E}[L(L-1)t^{L-2}] \notag\\ &= \frac{\mathrm{d}}{\mathrm{d}t}\left(\frac{sq}{1-qt}\right)G_{L}(t)+ \frac{sq}{1-qt} \frac{\mathrm{d}}{\mathrm{d}t}\Big(G_{L}(t)\Big) \notag\\ &= \frac{sq^{2}}{(1-qt)^{2}} G_{L}(t) + \left(\frac{sq}{1-qt}\right)^{2} G_{L}(t) \notag\\ &= \frac{(s^{2}+s)q^{2}}{(1-qt)^{2}} G_{L}(t) \notag \end{align} となり、$t=1$のとき \begin{align} \left. \frac{\mathrm{d}^{2}}{\mathrm{d}t^{2}} G_{L}(t) \right|_{t=1} &=\mathrm{E}[L(L-1)] \notag\\ &= \frac{(s^{2}+s)q^{2}}{(1-q)^{2}} G_{L}(1) \notag\\ &=(s^{2}+s) \frac{q^{2}}{p^{2}} \notag \end{align} となる。これを用いると \begin{align} \mathrm{E}[L(L-1)]+\mathrm{E}[L]-\left(\mathrm{E}[L]\right)^{2} &= s^{2}\frac{q^{2}}{p^{2}}+s\frac{q^{2}}{p^{2}}+\frac{sq}{p}-\left(\frac{sq}{p}\right)^{2}\notag\\ &= \frac{sq}{p^{2}}(q+p) \notag\\ &= \frac{sq}{p^{2}} \notag\\ &= \mathrm{Var}[L] \notag \end{align} となり、他の方法で得た分散と一致したため正しいだろう。

幾何分布、負の二項分布の結果を表に纏める。

幾何分布、負の二項分布の纏め
	幾何分布		負の二項分布
確率変数	試行回数 $n$	失敗回数 $l$	試行回数 $n$	失敗回数 $l$
終了条件	一回成功		$s$ 回成功
確率関数	$q^{n-1}p$	$q^{l}p$	$\binom{n-1}{s-1}q^{n-s}p^{s}$	$\binom{l+s-1}{s-1}q^{l}p^{s}$
期待値	$1/p$	$q/p$	$s/p$	$sq/p$
分散	$q/p^{2}$		$sq/p^{2}$
確率母関数	$\dfrac{pt}{1-qt}$	$\dfrac{p}{1-qt}$	$\left(\dfrac{pt}{1-qt}\right)^{s}$	$\left(\dfrac{p}{1-qt}\right)^{s}$

このように表にしてみると、確率関数は単純な線型関係ではないが、終了条件と期待値と分散とが$s$倍であることが分かる。幾何分布の拡張が負の二項分布であることが分かる。この更なる拡張はあるだろうか。ベルヌーイ分布の拡張である二項分布を更に拡張して多項分布があることを見た。同じように負の二項分布にも拡張として負の多項分布がある。

負の二項分布の導出は本節に記した負の二項定理、ポアソン分布ガンマ分布の混合、漸化式とパスカルの法則の他に
・負の超幾何分布の極限（負の超幾何分布の節に記した。）
・一般超幾何分布の特別な場合（一般超幾何分布の節に記した。）
・幾何分布の畳み込み（下書きはあるがまだ清書していない。）
・危険率、生存関数（下書きはあるがまだ清書していない。）
があり、加えて指数型確率分布の特別な場合、冪級数分布の特別な場合などもある。