露分け


負の超幾何分布

2025-12-26

二項分布とは復元抽出で試行回数$n$に達するまでの成功回数$s$の確率分布であり、負の二項分布とは成功回数$s$に達するまでの試行回数$n$あるいは失敗回数$l$の確率分布である。これは一つの事象を二つの視点から見たといえる。超幾何分布にも同じように対になる確率分布があり、これを負の超幾何分布というが、英語にはInverse Hypergeometric Distribution(逆超幾何分布)というものがあり、負の超幾何分布と同じものである。 参考  松尾精彦著 研究ノートInverse Hypergeometric分布に従う 確率変数の発生メカニズムについて

通常の超幾何分布の確率質量関数を、入れ物に$N=S+L$個の籤が入っているとして一度に$n=s+l$個の籤を引き、当たり$S$個の内$s$個を引くことの組み合わせと外れ$L$個の内$l$個を引くことの組み合わせとの積を、総数$N$個の内$n$個を引くことの組み合わせで割ることから求めた。 \[ \mathrm{HG}(s|S,N,n) =f_{\mathrm{HG}}(s) =\frac{\binom{S}{s} \binom{L}{l}}{\binom{N}{n}} \] この式を変形すると \begin{align} \mathrm{HG}(s|S,N,n) =\frac{\binom{S}{s} \binom{L}{l} }{\binom{N}{n}} =\frac{ \frac{S!}{s!(S-s)!} \frac{L!}{l!(L-l)!} }{ \frac{N!}{n!(N-n)!}} =\frac{\frac{n!}{s!l!} \frac{(N-n)!}{(S-s)!(L-l)!} }{\frac{N!}{S!L!}} =\frac{\binom{n}{s} \binom{N-n}{S-s} }{ \binom{N}{S} } \notag \end{align} となる。この式を引いた$n$個の中の当たりの数$s$の組み合わせと引かなかった$N-n$個の中の当たりの数$S-s$個の組み合わせとの積を全ての籤の数$N$と当たりの総数$S$の組み合わせで割ったものと解釈する。

一度に$n$個を引くことと、入れ物に戻すことなく一個引くのを$n$回繰り返すことは等しいと考える。$f_{S}(s)$を後者で解釈しなおす。$n$回引くとして$s$回当たりが出ることの順番の組み合わせは籤は当たり外れ以外に区別できる要素がないとき$\binom{n}{s}$となる。この試行の特徴として引いた籤を戻さない事が挙げられ、入れ物に残される籤の組み合わせは$N-n$から$S-s$を選ぶ組み合わせであり$\binom{N-n}{S-s}$である。この二つの組み合わせの積を全ての籤の数$N$と当たりの総数$S$の組み合わせで割ったものと解釈する。

負の二項分布は$s$回目の当たりを終了条件とし、$s-1$回目までの組み合わせを用いた。今回の負の超幾何分布も終了条件を$s$回目の当たりとする。上記の『 $n$回引くとして$s$回当たりが出ることの順番の組み合わせは籤は当たり外れ以外に区別できる要素がないとき$\binom{n}{s}$となる。』を基に 『$n-1$回引くとして$s-1$回当たりが出ることの順番の組み合わせは籤は当たり外れ以外に区別できる要素がないとき$\binom{n-1}{s-1}$となる。』とし$n$回目は$s$回目の当たりで固定されるため組み合わせには関係ない。 それ以外の組み合わせに変更はないため負の超幾何分布(Negative HyperGeometric Distribution)の確率質量関数を \[ \mathrm{NHG}(n|S,N,s) = f_{\mathrm{NHG}}(n) := \frac{\binom{n-1}{s-1} \binom{N-n}{S-s} }{ \binom{N}{S} } \] とする。これは試行回数$n$を確率変数としたものである。

負の二項分布は失敗回数$l$を確率変数としたものもある。同様に負の超幾何分布も 失敗回数$l$を確率変数としたものがある。幾何分布も負の二項分布も二種類の確率質量関数は変数の記し方が異なるだけで本質的に等しいように負の超幾何分布も等しい。 \[ \mathrm{NHG}(l|S,N,s) =f_{\mathrm{NHG}}(l) =f_{\mathrm{NHG}}(n) =\frac{\binom{n-1}{s-1} \binom{N-n}{S-s} }{ \binom{N}{S} } =\frac{\binom{l+s-1}{l} \binom{S+L-s-l}{L-l} }{ \binom{S+L}{L} } \] これは当たりの数$s$を$r$にし、外れの数$L,l$を$K,k$とすると ウィキペディアの記法 になる。 \[ f(k;N,K,r)= \frac {\binom{k+r-1}{k} \binom{N-r-k}{K-k} } { \binom{N}{K} } \] 元の式$f_{\mathrm{NHG}}(n)$に$s/n$を掛ける。分子の一番目の二項係数は \[ \frac{n}{s} \binom{n-1}{s-1} = \frac{n}{s} \frac{(n-1)!}{(s-1)!l!} = \binom{n}{s} \] となるため \[ \frac{n}{s} f_{\mathrm{NHG}}(n) = \frac{n}{s} \frac{\binom{n-1}{s-1} \binom{N-n}{S-s} }{ \binom{N}{S} } = \frac{\binom{n}{s} \binom{N-n}{S-s} }{ \binom{N}{S} } = \frac{\binom{S}{s} \binom{L}{l}}{\binom{N}{n}} = f_{\mathrm{HG}}(s) \] となる。これを書き換えると \[ \frac{s}{n} = \frac{f_{\mathrm{NHG}}(n)}{f_{\mathrm{HG}}(s)} = \frac{\mathrm{NHG}(n|S,N,s)}{\mathrm{HG}(s|S,N,n)} \] となる。この式を下記の条件付き確率と解釈する。 \begin{align} &P(\text{非復元抽出で最後に当たりを引く} | \text{非復元抽出で$n$回引き$s$回当たりを引く}) \notag\\ &= \frac{ P(\text{非復元抽出で最後に当たりを引く} \cap \text{非復元抽出で$n$回引き$s$回当たりを引く}) }{ P(\text{非復元抽出で$n$回引き$s$回当たりを引く}) }.\notag \end{align} また$nf_{\mathrm{NHG}}(n)=sf_{\mathrm{HG}}(s)$とも書ける。

試行回数$n$を確率変数とする場合について確率質量関数の総和が一になることを確かめる。まずこの確率変数の最低値は全て成功する場合$n=s$であり、最大値は$L$回全て失敗してから終了条件の成功回数に達する場合の$n=L+s$である。この範囲で総和をとると \[ \sum_{n=s}^{L+s} \mathrm{NHG}(n|S,N,s) = \sum_{n=s}^{L+s} \frac{\binom{n-1}{s-1} \binom{N-n}{S-s} }{ \binom{N}{S} } \] となる。上限については$L+s$より一つ大きい値では右側の二項係数が \[ \binom{N-(L+s+1)}{S-s} = \binom{S-s-1}{S-s} = 0 \] となる。そのため上限を無限に上げても総和は等しいままである。同じように下限を下げても左側の二項係数が零になるため等しいままである。故に \[ \sum_{n=s}^{L+s} \mathrm{NHG}(n|S,N,s) = \sum_{n=s}^{L+s} \frac{\binom{n-1}{s-1} \binom{N-n}{S-s} }{ \binom{N}{S} } = \sum_{n=1}^{\infty} \frac{\binom{n-1}{s-1} \binom{N-n}{S-s} }{ \binom{N}{S} } \] である。ここでもヴァンデルモンドの式を使うが通常の超幾何分布では通常の二項定理を用いてヴァンデルモンドの式を導出したのに対し、この負の超幾何分布では負の二項定理を用いる。負の二項定理 \[ (1-x)^{-a} = \sum_{i=0}^{\infty} \binom{a+i-1}{i} x^{i} \] において$b=a-1$と平行移動する。 \[ (1-x)^{-b-1} = \sum_{i=0}^{\infty} \binom{b+i}{i} x^{i} \] 更に$c=b+i$とすると \begin{align} (1-x)^{-b-1} = \sum_{c=b}^{\infty} \binom{c}{c-b} x^{-b+c} = \sum_{c=b}^{\infty} \binom{c}{b} x^{c-b} \notag \end{align} となる。$\binom{c}{c-b} = \binom{c}{b}$ であり $c < b$で$\binom{c}{b}=0$のため、零を足し合わせている見做して総和の下限を零まで下げることができる。この式を整理すると \[ \frac{1}{(1-x)^{b+1}} = \sum_{c=0}^{\infty} \binom{c}{b} x^{-b+c} \] となる。同様に \[ \frac{1}{(1-x)^{d+1}} = \sum_{e=0}^{\infty} \binom{e}{d} x^{-d+e} \] という式も成り立ち、積をとると \[ \frac{1}{(1-x)^{b+d+2}} = \sum_{c=0}^{\infty} \binom{c}{b} x^{-b+c} \sum_{e=0}^{\infty} \binom{e}{d} x^{-d+e} \] となる。左辺についても負の二項定理を用いた式変形ができる。 \begin{align} \text{左辺} &= \sum_{f=0}^{\infty} \binom{f}{b+d+1}x^{f-(b+d+1)} \notag\\ &= \left\{ \binom{0}{b+d+1}x^{0}+\binom{1}{b+d+1}x^{1}+\cdots+\binom{g+1}{b+d+1}x^{g+1}+\cdots \right\}x^{-b-d-1} \notag\\ &= \binom{0}{b+d+1}x^{-b-d-1}+\binom{1}{b+d+1}x^{-b-d} \cdots+\binom{g+1}{b+d+1} x^{g-b-d}+\cdots \notag \end{align} 右辺は \begin{align} \text{右辺} &= \sum_{c=0}^{\infty} \binom{c}{b} x^{-b+c} \sum_{e=0}^{\infty} \binom{e}{d} x^{-d+e} \notag\\ &= \left\{ \binom{0}{b}x^{-b}+\binom{1}{b}x^{-b+1}+\cdots+\binom{g}{b}x^{-b+g}+\cdots \right\} \notag\\ &\times\left\{ \binom{0}{d}x^{-d}+\binom{1}{d}x^{-d+1}+\cdots+\binom{g}{d}x^{-d+g}+\cdots \right\} \notag\\ &= \binom{0}{b}\binom{0}{d}x^{-b-d}+\left\{ \binom{1}{b}\binom{0}{d}+\binom{0}{b}\binom{1}{d} \right\}x^{1-b-d}+ \cdots \notag\\ &+ \left\{ \binom{g}{b}\binom{0}{d}+\binom{g-1}{b}\binom{1}{d}+\cdots+\binom{0}{b}\binom{g}{d} \right\}x^{g-b-d}\notag \end{align} となるため \[ \binom{g+1}{b+d+1} = \sum_{h=0}^{g} \binom{g-h}{b} \binom{h}{d} \] が成り立つ。これもヴァンデルモンドの式という。元々の総和の式の分子は$n'=n-1,\ N'=N-1,\ s'=s-1,\ S'=S-1$とすると \[ \sum_{n=1}^{\infty}\binom{n-1}{s-1} \binom{N-n}{S-s} = \sum_{n'=0}^{\infty}\binom{n'}{s'} \binom{N'-n'}{S'-s'} \] と書ける。右の二項係数から$n'=S'+1,\ldots,\infty$は零になるため総和から外しても等しい。更にこの式で$n'=h,\ N'=g,\ s'=d,\ S'-s'=b$とすると負のヴァンデルモンドの式に当てはまる。よって \begin{align} \sum_{n=1}^{\infty}\binom{n-1}{s-1} \binom{N-n}{S-s} &= \sum_{n'=0}^{N'} \binom{n'}{s'} \binom{N'-n'}{S'-s'} \notag\\ &= \binom{N'+1}{S'-s'+s'+1} \notag\\ &= \binom{N}{S} \notag \end{align} である。そのため \[ \sum_{n=s}^{\infty} \mathrm{NHG}(n|S,N,s) = \sum_{n=1}^{\infty} \frac{\binom{n-1}{s-1} \binom{N-n}{S-s} }{ \binom{N}{S} } = 1 \] である。同じ様に$l'=l+s-1$として計算することで \begin{align} \sum_{l=0}^{\infty} \mathrm{NHG}(l|S,L,s) &= \sum_{l=0}^{\infty} \frac{\binom{s-1+l}{s-1}\binom{S+L-s-l}{S-s} }{\binom{S+L}{S}} \notag\\ &= \frac{1}{\binom{S+L}{S}} \sum_{l=0}^{\infty} \binom{S+L-s-l}{S-s} \binom{s-1+l}{s-1} \notag\\ &= \frac{1}{\binom{S+L}{S}} \sum_{l'=0}^{S+L-1} \binom{S+L-1-l'}{S-s} \binom{l'}{s-1} \notag\\ &= \frac{1}{\binom{S+L}{S}} \binom{(S+L-1)+1}{(S-s)+(s-1)+1} \notag\\ &=1\notag \end{align} つまり \begin{align} \sum_{l=0}^{\infty} \mathrm{NHG}(l|S,L,s) =\sum_{l=0}^{\infty} \frac{\binom{l+s-1}{l} \binom{S+L-s-l}{L-l}}{\binom{S+L}{L}} =1 \label{eq:NHG1} \end{align} を得る。

期待値を求める。まず \begin{align} \mathrm{E}[\mathcal{N}] &= \sum_{n=s}^{\infty} n f_{\mathrm{NHG}}(n) \notag\\ &= \sum_{n=s}^{\infty} s f_{\mathrm{HG}}(s) \notag\\ &= \frac{s}{\binom{N}{S}} \sum_{n=0}^{N} \binom{n}{s} \binom{N-n}{S-s} \notag \end{align} と書き換える。負のヴァンデルモンドの式より \[ \mathrm{E}[\mathcal{N}] =s \frac{ \binom{N+1}{S+1} }{ \binom{N}{S} } =s\frac{N+1}{S+1}=\frac{s}{\frac{S+1}{N+1}} \] となる。

分散を求める。二項分布でも階乗積率を利用したように階差を利用する。期待値でも用いた$nf_{N}(n)=sf_{S}(s)$は \[ n\binom{n-1}{s-1} = \frac{s}{s} n\frac{(n-1)!}{(s-1)!l!} =s \binom{n}{s} \] という計算に由来するとも解せる。超幾何分布で用いた階差は$\mathrm{E}[\mathcal{S}(\mathcal{S}-1)]$のように引くものであった。これを応用して計算を試みたものの失敗に終わった。超幾何関数を用いない方法ではできないものと思われる。そのためここでは足す階差を用いる。 \begin{align} (n+1)n \binom{n-1}{s-1} &= (n+1)s\binom{n}{s} \notag\\ &= s(n+1)\frac{s+1}{s+1} \frac{n!}{s!l!} \notag\\ &= (s+1)s \frac{(n+1)!}{(s+1)!(n+1-(s+1))!} \notag\\ &= (s+1)s \binom{n+1}{s+1}. \notag \end{align} この計算から \begin{align} \mathrm{E}[(\mathcal{N}+1) \mathcal{N}] &=0+ \sum_{n=1}^{\infty} (n+1)n \ \mathrm{NHG}(n|S,N,s) \notag\\ &= \sum_{n=0}^{\infty} (n+1)s \ \mathrm{HG}(s|S,N,n) \notag\\ &= \frac{1}{\binom{N}{S}} \sum_{n=0}^{\infty}(s+1)s \binom{n+1}{s+1} \binom{N+1-(n+1)}{S+1-(s+1)} \notag\\ &= \frac{(s+1)s}{\binom{N}{S}} \binom{N+2}{S+2} \notag\\ &= (s+1)s \frac{(N+2)(N+1)}{(S+2)(S+1)} \notag \end{align} となる。これを用いれば先程計算できなかった一次の階乗積率 \begin{align} \mathrm{E}[\mathcal{N}(\mathcal{N}-1)] &=\mathrm{E}[(\mathcal{N}+1)\mathcal{N}]-2\mathrm{E}[\mathcal{N}] \notag\\ &=(s+1)s \frac{(N+2)(N+1)}{(S+2)(S+1)}-2s\frac{N+1}{S+1} \notag\\ &=s\frac{N+1}{S+1}\left\{ (s+1)\frac{N+2}{S+2}-2\right\} \notag\\ &= \frac{s(N+1)(sN+N+2s-2S-2)}{(S+1)(S+2)} \label{eq:NHGN(N-1)} \end{align} を得る。 分散は \begin{align} \mathrm{Var}[\mathcal{N}] &= \mathrm{E}[(\mathcal{N}-\mathrm{E}[\mathcal{N}])^{2}] \notag\\ &= \mathrm{E}[(\mathcal{N}+1)\mathcal{N}]-\mathrm{E}[\mathcal{N}]-\left(\mathrm{E}[\mathcal{N}]\right)^{2} \notag\\ &= \left( s\frac{N+1}{S+1}\right) \left\{ (s+1)\frac{N+2}{S+2} -1-s\frac{N+1}{S+1} \right\} \notag\\ &= \left( s\frac{N+1}{S+1}\right) \left\{ \frac{ s\left((N+2)(S+1)-(S+2)(N+1)\right) + (N+2)(S+1)-(S+2)(S+1) }{ (S+2)(S+1) } \right\} \notag\\ &= \left( s\frac{N+1}{S+1}\right) \left\{ \frac{ s\left(-N+S\right) + NS+N-S^{2}-S }{ (S+2)(S+1) } \right\} \notag\\ &= s \frac{(N+1)L(S+1-s)}{(S+2)(S+1)(S+1)} \notag\\ &= \frac{S+1-s}{S+1+1}s \frac{N+1}{S+1} \frac{L}{S+1} \notag \end{align} となる。近似として期待値は$(S+1)/(N+1)\simeq S/N =p$とすると \[ \mathrm{E}[\mathcal{N}]=\frac{s}{p} \] となる。これは試行回数を確率変数とした負の二項分布の期待値である。続いて分散を \[ \mathrm{Var}[\mathcal{N}] =\frac{S+1-s}{S+1+1} \cdot s \cdot \frac{N+1}{S+1} \cdot \frac{L}{S+1} \] と分ける。一番目は$S$が$s$より充分大きければ一と見做せる。恐らくこれが負の超幾何分布における有限母集団修正である。 三番目の項は期待値と同じく$p$の逆数と近似できる。四番目は \[ \frac{L}{S+1}\simeq \frac{N-S}{S} = \frac{1}{p}-1 \] と近似でき、以上より \[ \mathrm{Var}[\mathcal{N}] \simeq 1 \cdot s \cdot \frac{1}{p} \cdot \left( \frac{1}{p}-1 \right) =s \frac{1-p}{p^{2}} =s \frac{q}{p^{2}} \] と近似できる。これは負の二項分布の分散である。失敗回数$l$の期待値は$n=s+l$の関係より \begin{align} \mathrm{E}[\mathcal{L}] &=\sum_{l=0}^{\infty} l \ \mathrm{NHG}(l|S,N,s) \notag\\ &=\sum_{n=s}^{\infty} n \ \mathrm{NHG}(n|S,N,s) -\sum_{n=s}^{\infty} s \ \mathrm{NHG}(n|S,N,s) \notag\\ &=\sum_{n=0}^{\infty} n \ \mathrm{NHG}(n|S,N,s) -s \sum_{n=0}^{\infty} \ \mathrm{NHG}(n|S,N,s) \notag\\ &=\mathrm{E}[\mathcal{N}] -s \notag\\ &=s \frac{L}{S+1} \label{eq:NHGEL} \end{align} となる。$S+1\simeq S$とすると \[ \mathrm{E}[\mathcal{L}]\simeq s\left(\frac{1}{p}-1\right)=s\frac{q}{p} \] となる。これは失敗回数を確率変数とした場合の負の二項分布の期待値である。分散を計算してみると \begin{align} \mathrm{Var}[\mathcal{L}] &=\sum_{l=0}^{\infty} (l - \mathrm{E}[\mathcal{L}])^{2}\ \mathrm{NHG}(l|S,N,s) \notag\\ &=\sum_{l=0}^{\infty} l^{2}\ \mathrm{NHG}(l|S,N,s) - \left(\mathrm{E}[\mathcal{L}]\right)^{2} \sum_{l=0}^{\infty} \ \mathrm{NHG}(l|S,N,s) \notag\\ &=\sum_{n=s}^{\infty} n^{2} \ \mathrm{NHG}(n|S,N,s) -2s \sum_{n=s}^{\infty} n \ \mathrm{NHG}(n|S,N,s) +s^{2}\sum_{n=s}^{\infty} \ \mathrm{NHG}(n|S,N,s) -\left(\mathrm{E}[\mathcal{L}]\right)^{2} \cdot 1 \notag\\ & =\sum_{n=0}^{\infty} n^{2} \ \mathrm{NHG}(n|S,N,s) -2s \sum_{n=0}^{\infty} n \ \mathrm{NHG}(n|S,N,s) +s^{2} \cdot 1 -\left(\mathrm{E}[\mathcal{N}]-s\right)^{2} \notag\\ &=\mathrm{E}[\mathcal{N}^{2}] -2s\mathrm{E}[\mathcal{N}]+s^{2} -\left(\mathrm{E}[\mathcal{N}]\right)^{2}+2s\mathrm{E}[\mathcal{N}]-s^{2} \notag\\ &=\mathrm{E}[\mathcal{N}^{2}]-\left(\mathrm{E}[\mathcal{N}]\right)^{2} \notag\\ &=\mathrm{Var}[\mathcal{N}] \notag\\ &=\frac{S+1-s}{S+1+1}s \frac{N+1}{S+1} \frac{L}{S+1} \notag \end{align} となり、試行回数を確率変数とした場合と等しい。つまり \[ \mathrm{Var}[\mathcal{L}] = \frac{S+1-s}{S+1+1}s \frac{S+1+L}{S+1} \frac{L}{S+1} \] である。

確率母関数は \begin{align} G_{N}(t) &=\mathrm{E}[t^{\mathcal{N}}] \notag\\ &=\sum_{n=1}^{\infty} t^{n} f_{N}(n) \notag\\ &=\sum_{n=1}^{\infty} t^{n} \frac{\binom{n-1}{s-1} \binom{N-n}{S-s}}{\binom{N}{S}} \notag \end{align} である。超幾何関数を用いる。計算の都合、総和の引数を$l=n-s$に変える。このとき引数は$l=1-s,\ 2-s,\cdots,\infty$となる。分子の$\binom{n-1}{s-1}=\binom{l+s-1}{s-1}$に代入すると \[ \binom{0}{s-1},\ \binom{1}{s-1},\cdots, \] となり、始めの値は零になる。$l=0$のとき \[ \binom{s-1}{s-1} \] となることから総和の下限を$0$とする。超幾何分布と同じように負の数の上昇階乗記号に書き換える。まず分子の左側の二項係数は \begin{align} \binom{n-1}{s-1} &= \frac{(n-1)(n-2)\cdots (n-1-(s-1)+1)}{(s-1)!} \frac{l!}{l!} \notag\\ &= \frac{(n-1)(n-2)\cdots(s+1)s }{l!} \frac{(s-1)!}{(s-1)!} \notag\\ &= (-1)^{(n-1)-s+1} \frac{(-n+1)(-n+2)\cdots(-s-1)(-s)}{l!} \notag\\ &= (-1)^{l} \frac{(-s)^{\overline{l}}}{l!} \notag \end{align} と書き換えられる。右側の二項係数は \begin{align} \binom{N-s-l}{S-s} &= \frac{(N-s)^{\overline{l}}}{(N-s)^{\overline{l}}} \frac{L^{\overline{l}}}{L^{\overline{l}}} \frac{(N-s-l)!}{(S-s)!(L-l)!} \notag\\ &= \frac{(N-s)!}{(S-s)!L!} \frac{L^{\overline{l}}}{(N-s)^{\overline{l}}} \notag\\ &= \binom{N-s}{S-s} \frac{(-1)^{l} (-L)^{\overline{l}}}{(-1)^{l}(-N+s)^{\overline{l}}} \notag\\ &= \binom{N-s}{S-s} \frac{ (-L)^{\overline{l}}}{(-N+s)^{\overline{l}}} \notag \end{align} と換えられる。このため確率母関数は \begin{align} G_{N}(t) &=\mathrm{E}[t^{\mathcal{N}}] \notag\\ &=\sum_{n=1}^{\infty} t^{n} \frac{\binom{n-1}{s-1} \binom{N-n}{S-s}}{\binom{N}{S}} \notag\\ &=\frac{\binom{N-s}{S-s}}{\binom{N}{S}} t^{s}\sum_{l=0}^{\infty}(-1)^{l} \frac{(-s)^{\overline{l}} (-L)^{\overline{l}}}{(-N+s)^{\overline{l}}} \frac{t^{l}}{l!}\notag \end{align} と書けるが、$(-1)$があり都合が悪い。そこで左側の二項係数は負の数では無く正の数の上昇冪にする。 \[ \binom{n-1}{s-1} = \frac{s^{\overline{l}}}{l!} \] 元々、負の数の上昇冪にするのは総和の上限が無限であり発散の可能性があるものの、負の数の上昇冪にすることで一定以上の引数では \[ (-s)^{\overline{l}}=(-s)(-s+1)\cdots0\cdots=0 \] と零となり回避できる。正数である$s$の無限回の上昇冪は確かに無限になるが、分子全体で見ればもう一つの$(-L)^{\overline{l}}$は$l$が無限大になるとき \[ (-L)^{\overline{l}}=(-L)(-L+1)\cdots0\cdots=0 \] と確実に零になるため発散は回避できる。そのため分子の一方は負の数の上昇冪にする必要はない。むしろ振動を回避するため$s$は正の数の上昇冪にする。よって \begin{align} G_{N}(t) &=\mathrm{E}[t^{\mathcal{N}}] \notag\\ &=\frac{\binom{N-s}{S-s}}{\binom{N}{S}} t^{s}\sum_{l=0}^{\infty} \frac{s^{\overline{l}} (-L)^{\overline{l}}}{(-N+s)^{\overline{l}}} \frac{t^{l}}{l!}\notag\\ &=t^{s} \frac{\binom{S}{s}}{\binom{N}{s}} {}_{2}\mathrm{F}_{1} \left[ \begin{matrix} -L,\ s \\ -N+s \end{matrix} \ ;t \right]\notag \end{align} である。二項係数については \[ \frac{\binom{N-s}{S-s}}{\binom{N}{S}} = \frac{ \frac{(N-s)!}{(S-s)!L!}}{ \frac{N!}{S!L!}} = \frac{ \frac{S!}{(S-s)!s!}}{ \frac{N!}{(N-s)!s!}} = \frac{\binom{S}{s}}{\binom{N}{s}} \] と変形した。$t=1$のときの超幾何関数はガウスの公式より計算すると負の階乗つまりガンマ関数の極が現れるため$F(-n,b/c;1)=(c-b)^{\overline{n}} / c^{\overline{n}}$から計算する。 \begin{align} {}_{2} \mathrm{F}_{1} \left[ \begin{matrix} -L,\ s \\ -N+s \end{matrix} \ ;1 \right] &= \frac{(-N+s-s)^{\overline{L}}}{(-N+s)^{\overline{L}}} \notag\\ &= \frac{(-N)(-N+1)\cdots(-N+L-1) }{ (-N+s)(-N+s+1)\cdots(-N+s+L-1) } \notag\\ &= \frac {(-1)^{L} N(N-1)\cdots(N-L+1) }{ (-1)^{L} (N-s)(N-s-1)\cdots(N-L-s+1) } \notag\\ &= \frac{ \frac{N!}{S!} }{ \frac{ (N-s)! }{ (S-s)! } } \notag\\ &= \frac{ \frac{N!}{(N-s)!} }{ \frac{S!}{(S-s)!} }\notag\\ &= \frac{\binom{N}{s}}{\binom{S}{s}} \notag \end{align} となるため確率母関数は \begin{align} G_{N}(t) =\mathrm{E}[t^{\mathcal{N}}] =t^{s} \frac{F(-L,s/-N+s;t)}{F(-L,s/-N+s;1)}\notag \end{align} と書ける。また$t=1$のとき \[ G_{N}(1)=\mathrm{E}[1^{\mathcal{N}}]= 1^{n} \frac{\binom{S}{s}}{\binom{N}{s}} \frac{\binom{N}{s}}{\binom{S}{s}} =1 \] となる。超幾何関数の節で求めたように \[ \left. \frac{\mathrm{d}^{k}}{\mathrm{d}z^{k}} G(z) \right|_{z=1} =\frac{a^{\overline{k}}b^{\overline{k}}}{c^{\overline{k}}} \frac{F(a+k,b+k/c+k;1)}{F(a,b/c;1)} = \frac{a^{\overline{k}} b^{\overline{k}}}{(c-a-b-1)^{\underline{k}}} \] であり、これに$a=-L,\ b=s,\ c=-N+s,\ z=t$を代入すると \[ \left. \frac{\mathrm{d}^{k}}{\mathrm{d}t^{k}} G(t) \right|_{t=1} = \left. \frac{\mathrm{d}^{k}}{\mathrm{d}t^{k}} \frac{F(-L,s/-N+s;t)}{F(-L,s/-N+s;1)} \right|_{t=1} = s^{\overline{k}} \frac{(-L)^{\overline{k}} }{(-S-1)^{\underline{k}}} \] となる。分数は \[ \frac{(-L)^{\overline{k}} }{(-S-1)^{\underline{k}}} = \frac{(-L)(-L+1)\cdots(-L+k-1)}{(-S-1)(-S-2)\cdots(-S-k)} = \frac{(-1)^{k}L(L-1)\cdots(L-k+1)}{(-1)^{k}(S+1)(S+2)\cdots(S+k)} = \frac{L^{\underline{k}}}{(S+1)^{\overline{k}}} \] と計算でき、試行回数の超幾何関数は \[ G_{N}(t)t^{-s}=\frac{F(-L,s/-N+s;t)}{F(-L,s/-N+s;1)} \] と書き換えられる。そのため \[ \left. \frac{\mathrm{d}^{k}}{\mathrm{d}t^{k}} \Big( t^{-s} G(t) \Big) \right|_{t=1} = \left. \frac{\mathrm{d}^{k}}{\mathrm{d}z^{k}} \frac{F(a,b/c;z)}{F(a,b/c;1)} \right|_{z=1} = s^{\overline{k}} \frac{(-L)^{\overline{k}} }{(-S-1)^{\underline{k}}} \] となる。この左辺から$t^{-s}$を取り出し、簡潔な表記にすることは難しい。しかし$l$を確率変数とした場合については \begin{align} G_{L}(t) &=\mathrm{E}[t^{\mathcal{L}}] \notag\\ &=\sum_{l=0}^{\infty} t^{l} \ \mathrm{NHG}(l|S,N,s) \notag\\ &=t^{-s} \sum_{l=0}^{\infty} t^{n} \ \mathrm{NHG}(n|S,N,s) \notag\\ &=t^{-s} G_{N}(t) \notag\\ &=\frac{F(-L,s/-N+s;t)}{F(-L,s/-N+s;1)}\notag \end{align} となり、上で行き詰った$t^{-s}G_{N}(t)$の$k$階微分に$G_{L}(t)=t^{-s}G_{N}(t)$を代入すると \[ \left. \frac{\mathrm{d}^{k}}{\mathrm{d}t^{k}} G_{L}(t) \right|_{t=1} = \mathrm{E}[\mathcal{L}^{\underline{k}}] = \frac{(-L)^{\overline{k}} s^{\overline{k}}}{(-S-1)^{\underline{k}}} = s^{\overline{k}} \frac{L^{\underline{k}} }{(S+1)^{\overline{k}}} \] となる。$k=1$のとき \begin{align} \left. \frac{\mathrm{d}}{\mathrm{d}t} G(t) \right|_{t=1} = \mathrm{E}[\mathcal{L}] =s\frac{L}{S+1} \notag \end{align} となる。$k=2$で \begin{align} \left. \frac{\mathrm{d}^{2}}{\mathrm{d}t^{2}} G(t) \right|_{t=1} = \mathrm{E}[\mathcal{L}(\mathcal{L}-1)] = (s+1)s\frac{L(L-1)}{(S+2)(S+1)} \label{eq:NHGL(L-1)} \end{align} となる。この近似として$L(L-1)/(S+2)(S+1)\simeq L^{2}/S^2$とすると$L/S=(N-S)/S=1/p-1=q/p$となるため \[ \left. \frac{\mathrm{d}^{2}}{\mathrm{d}t^{2}} G(t) \right|_{t=1} = \mathrm{E}[\mathcal{L}(\mathcal{L}-1)] =s(s+1)\frac{L(L-1)}{(S+2)(S+1)} \simeq s(s+1)\left(\frac{1}{p}-1\right)^{2} = (s^2+s)\frac{q^2}{p^2} \] となる。これは外れを確率変数とする負の二項分布の階差と等しい。

改めて試行回数に話を戻す。$k$階微分は$t=1$のとき \[ \left. \frac{\mathrm{d}^{k}}{\mathrm{d}t^{k}} G_{N}(t) \right|_{t=1} = \mathrm{E}[\mathcal{N}^{\underline{k}}] \] である。

和の下降階乗冪は以下のように展開できる。 \[ (x+y)^{\underline{k}} =\sum_{j=0}^{k} \binom{k}{j} x^{\underline{k-j}} y^{\underline{j}} \] これはヴァンデルモンドの式 \[ \binom{x+y}{k} = \sum_{j=0}^{k} \binom{x}{j}\binom{y}{k-j} \] に$k!$を掛けると得られる。$\binom{a}{b}=a^{\underline{b}}/b!$より \begin{align} k! \binom{x+y}{k} &= k! \sum_{j=0}^{k} \binom{x}{k-j}\binom{y}{j} \notag\\ k! \frac{(x+y)^{\underline{k}}}{k!} &= \sum_{j=0}^{k} k! \frac{x^{\underline{k-j}}}{(k-j)!} \frac{y^{\underline{j}}}{j!} \notag\\ (x+y)^{\underline{k}} &= \sum_{j=0}^{k} \binom{k}{j} x^{\underline{k-j}} y^{\underline{j}} \notag \end{align} となる。他にも数学的帰納法で示せる。この方法は二項定理の章に記した。\\  $n=s+l$より$n$の下降階乗冪は \[ n^{\underline{k}} =(s+l)^{\underline{k}} =\sum_{j=0}^{k} \binom{k}{j} s^{\underline{k-j}} l^{\underline{j}} \] となるため、 \[ \left. \frac{\mathrm{d}^{k}}{\mathrm{d}t^{k}} G_{N}(t) \right|_{t=1} = \mathrm{E}[\mathcal{N}^{\underline{k}}] =\sum_{j=0}^{k} \binom{k}{j} s^{\underline{k-j}} \mathrm{E}[ L^{\underline{j}}] =\sum_{j=0}^{k} \binom{k}{j} s^{\underline{k-j}} s^{\overline{j}} \frac{L^{\underline{j}} }{(S+1)^{\overline{j}}} \] となる。$k=1$のとき$N^{\underline{1}}=N$であるため \begin{align} \left. \frac{\mathrm{d}^{1}}{\mathrm{d}t^{1}} G_{N}(t) \right|_{t=1} &= \mathrm{E}[\mathcal{N}] \notag\\ &=\sum_{j=0}^{1} \binom{1}{j} s^{\underline{1-j}} s^{\overline{j}} \frac{L^{\underline{j}} }{(S+1)^{\overline{j}}} \notag\\ &= \binom{1}{0} s^{\underline{1}} s^{\overline{0}} \frac{L^{\underline{0}} }{(S+1)^{\overline{0}}} + \binom{1}{1} s^{\underline{0}} s^{\overline{1}} \frac{L^{\underline{1}} }{(S+1)^{\overline{1}}} \notag\\ &= s+s\frac{L}{S+1} \notag\\ &= s\frac{N+1}{S+1} \notag \end{align} となる。これは既に求めた期待値と一致する。一次の階乗積率は$k=2$より \begin{align} \left. \frac{\mathrm{d}^{2}}{\mathrm{d}t^{2}} G_{N}(t) \right|_{t=1} &= \mathrm{E}[\mathcal{N}(\mathcal{N}-1)] \notag\\ &=\sum_{j=0}^{2} \binom{2}{j} s^{\underline{2-j}} s^{\overline{j}} \frac{L^{\underline{j}} }{(S+1)^{\overline{j}}} \notag\\ &= \binom{2}{0} s^{\underline{2}} s^{\overline{0}} \frac{L^{\underline{0}} }{(S+1)^{\overline{0}}} + \binom{2}{1} s^{\underline{1}} s^{\overline{1}} \frac{L^{\underline{1}} }{(S+1)^{\overline{1}}} + \binom{2}{2} s^{\underline{0}} s^{\overline{2}} \frac{L^{\underline{2}} }{(S+1)^{\overline{2}}} \notag\\ &= s(s-1)+2s^{2}\frac{L}{S+1} +(s+1)s \frac{L(L-1)}{(S+2)(S+1)}\notag\\ &= \frac{s}{(S+2)(S+1)}\Big\{ (s-1)(S^{2}+3S+2)+2sL(S+2)+(s+1)L(L-1) \Big\} \notag \end{align} となる。既に求めた形に合わせるため$L$を$N-S$とすると \begin{align} \left. \frac{\mathrm{d}^{2}}{\mathrm{d}t^{2}} G_{N}(t) \right|_{t=1} &= \mathrm{E}[\mathcal{N}(\mathcal{N}-1)] \notag\\ &= \frac{s}{(S+2)(S+1)}\Big\{ (s-1)(S^{2}+3S+2)+2sL(S+2)+(s+1)L(L-1) \Big\} \notag\\ &= \frac{s}{(S+2)(S+1)}\Big\{ (s-1)(S^{2}+3S+2)+2s(N-S)(S+2)+(s+1)(N-S)(N-S-1) \Big\} \notag \end{align} となる。この括弧の中は \begin{align} &(s-1)(S^{2}+3S+2)+2s(N-S)(S+2)+(s+1)(N-S)(N-S-1) \notag\\ &= (sS^{2} +3sS+2s-S^{2}-3S-2)+ (2sNS+4sN-2sS^{2}-4sS) \notag\\ &+ (sN^{2}-sNS-sN-sNS+sS^{2}+sS+N^{2}-NS-N-NS+S^{2}+S) \notag\\ &= 4sS+2s-2S-2+(2sN+sN)+sN^{2}+N^{2}-2NS+(-2N+N) \notag\\ &= N(sN+N+2s-2S-2) + (sN+N+2s-2S-2) \notag\\ &= (N+1)(sN+N+2s-2S-2) \notag \end{align} と計算できるため \[ \left. \frac{\mathrm{d}^{2}}{\mathrm{d}t^{2}} G_{N}(t) \right|_{t=1} = \mathrm{E}[\mathcal{N}(\mathcal{N}-1)] = \frac{s(N+1) (sN+N+2s-2S-2)}{(S+2)(S+1)} \] である。これはすでに求めた階乗積率と一致する。

 負の二項分布と比べる。負の超幾何分布の確率質量関数を \begin{align} \mathrm{NHG}(l | S,N,s) &= \frac{\binom{l+s-1}{l} \binom{S+L-s-l}{L-l} }{ \binom{S+L}{L} } \notag\\ &=\binom{l+s-1}{l} \frac{(S+L-s-l)! }{(S+L)!} \frac{L!S!}{(L-l)!(S-s)!} \notag\\ &=\binom{l+s-1}{l} \frac{ (S+L-s-l)!}{ (S+L)^{\underline{n}}(S+L-n)! } L^{\underline{l}} S^{\underline{s}} \notag\\ &=\binom{l+s-1}{l} \frac{ L^{\underline{l}} S^{\underline{s}}}{ N^{\underline{n}} } \notag \end{align} と書き換える。下降階乗は$n=s+l$より \begin{align} N^{\underline{n}} &= N(N-1)\cdots(N-l+1) \cdot (N-l)\cdots(N-n+1) \notag\\ &= N^{\underline{l}} (N-l)^{\underline{s}} \notag \end{align} と分けられる。$N$が$l$より充分大きいとき$N-l\sim N$と見做せるため \[ N^{\underline{n}} \sim N^{\underline{l}} N^{\underline{s}} \] と近似できる。そのため \begin{align} \mathrm{NHG}(l | S,N,s) \sim\binom{l+s-1}{l} \frac{ L^{\underline{l}} }{ N^{\underline{l}} } \frac{S^{\underline{s}} }{ N^{\underline{s}} } \notag \end{align} となる。加えて$L$が$l$より充分大きいとき \[ \frac{ L^{\underline{l}} }{ N^{\underline{l}} } = \frac {L(L-1)\cdots(L-l+1) } {N(N-1)\cdots(N-l+1)} \sim \frac { L\cdot L \cdots L\cdot L} { N\cdot N \cdots N\cdot N} = \left(\frac{L}{N}\right)^{l} \] となる。$q=L/N$とし、同じように近似し$p=S/N$とすると \[ \mathrm{NHG}(l | S,N,s) \sim \binom{l+s-1}{l} q^{l}p^{s} \] となる。また二階の階乗積率 \begin{align} \mathrm{E}[\mathcal{N}(\mathcal{N}-1)] &= s \frac{(N+1)(sN+N+2s-2S-2)}{(S+1)(S+2)} \notag \end{align} は分子の二番目の括弧を$N+1$で割ると \begin{align} \frac{sN+N+2s-2S-2}{N+1} &= s\frac{N+2}{N+1}+\frac{N-2}{N+1}-2\frac{S}{N+1} \notag \end{align} となる。$S,\ N$が充分大きければ \[ \frac{sN+N+2s-2S-2}{N+1} \sim s+1-2p \] となる。そのため \begin{align} \mathrm{E}[\mathcal{N}(\mathcal{N}-1)] &= s \frac{(N+1)(sN+N+2s-2S-2)}{(S+1)(S+2)} \notag\\ &= s \frac{ \frac{N+1}{N+1} \frac{sN+N+2s-2S-2}{N+1} }{ \frac{S+1}{N+1} \frac{S+2}{N+1} } \notag\\ &\sim s \frac{ s+1-2p}{p^{2}} \notag \end{align} となる。これは負の二項分布の二階の階乗積率である。試行回数を確率変数とするとき負の二項分布は一般化が困難であるが、失敗回数とした場合 \[ \mathrm{E_{NB}}[L^{\underline{k}}] = s^{\overline{k}} \left( \frac{q}{p} \right)^{k} \] は \[ \frac{L^{\underline{k}} }{(S+1)^{\overline{k}}} = \frac{ \frac{L^{\underline{k}} }{N^{k} } }{ \frac{(S+1)^{\overline{k}}}{ N^{k} } } \sim \left( \frac{q}{p} \right)^{k} \] と近似できるため \[ \left. \frac{\mathrm{d}^{k}}{\mathrm{d}t^{k}} G_{L}(t) \right|_{t=1} = \mathrm{E_{NHG}}[\mathcal{L}^{\underline{k}}] = s^{\overline{k}} \frac{L^{\underline{k}} }{(S+1)^{\overline{k}}} \sim \mathrm{E_{NB}}[L^{\underline{k}}] \] である。他は表に纏めた。

負の超幾何分布、負の二項分布の纏め
負の超幾何分布 負の二項分布
確率変数 試行回数\(n\) 失敗回数\(l\) 試行回数\(n\) 失敗回数\(l\)
確率関数 \(\binom{n-1}{s-1}\,\frac{\binom{N-n}{S-s}}{\binom{N}{L}}\) \(\binom{l+s-1}{l}\,\frac{\binom{S+L-s-l}{L-l}}{\binom{S+L}{L}}\) \(\binom{n-1}{s-1}q^{\,n-s}p^{\,s}\) \(\binom{l+s-1}{l}q^{\,l}p^{\,s}\)
期待値 \(s\frac{N+1}{S+1}\) \(s\frac{L}{S+1}\) \(s/p\) \(sq/p\)
分散 \(\frac{S+1-s}{S+1+1}\,s\,\frac{N+1}{S+1}\,\frac{L}{S+1}\) \(sq/p^{2}\)
確率母関数 \(t^{s}\frac{F(-L,s\ / \ -N+s\ ;\ t)}{F(-L,s\ / \ -N+s\ ;\ 1)}\) \(\frac{F(-L,s\ / \ -N+s\ ;\ t)}{F(-L,s\ / \ -N+s\ ;\ 1)}\) \(t^{s}\left(p/(1-qt)\right)^{s}\) \(\left(p/(1-qt)\right)^{s}\)