幾何分布および負の二項分布は、ベルヌーイ試行の繰り返しにおいて「成功が現れるまでの試行回数」や「一定回数の成功が得られるまでの試行回数」をモデル化する離散型確率分布である。これらは待ち時間の分布として解釈される。
成功確率 $p \in (0,1)$ の独立なベルヌーイ試行を繰り返すとき、最初の成功が現れるまでの試行回数を表す確率変数 $X$ は幾何分布に従う。
\[P(X = k) = (1-p)^{k-1} p, \quad k = 1,2,\dots\]
\[\mathbb{E}[X] = \frac{1}{p}, \quad \mathrm{Var}(X) = \frac{1-p}{p^2}\]
幾何分布は無記憶性を持つ。すなわち、任意の $m,n \in \mathbb{N}$ に対して、
\[P(X > m+n \mid X > m) = P(X > n)\]
が成立する。この性質は指数分布の離散版に対応する。
\[M_X(t) = \frac{p e^t}{1 - (1-p)e^t}, \quad (t < -\log(1-p))\]
成功確率 $p \in (0,1)$ の独立なベルヌーイ試行において、$r$ 回目の成功が現れるまでの試行回数を表す確率変数 $X$ は負の二項分布に従う。
\[P(X = k) = \binom{k-1}{r-1} p^r (1-p)^{k-r}, \quad k = r, r+1, \dots\]
\[\mathbb{E}[X] = \frac{r}{p}, \quad \mathrm{Var}(X) = \frac{r(1-p)}{p^2}\]
試行回数 $k$ において最後の試行が成功であるとすると、それ以前の $k-1$ 回の試行の中に $r-1$ 回の成功が含まれる必要がある。その組合せ数が $\binom{k-1}{r-1}$ であり、これに確率 $p^r (1-p)^{k-r}$ を掛けることで確率質量関数が得られる。
\[M_X(t) = \left( \frac{p e^t}{1 - (1-p)e^t} \right)^r\]
幾何分布は負の二項分布の特別な場合であり、$r = 1$ のとき
\[\mathrm{NegBin}(1,p) = \mathrm{Geom}(p)\]
が成立する。
負の二項分布は、「$r$ 回の成功が得られるまでの失敗回数」としても定義される。この場合、確率変数 $Y = X - r$ に対して、
\[P(Y = k) = \binom{k + r - 1}{r - 1} p^r (1-p)^k, \quad k = 0,1,2,\dots\]
となる。
負の二項分布はポアソン分布の混合分布としても解釈できる。すなわち、ポアソン分布のパラメータ $\lambda$ がガンマ分布に従う場合、その混合分布は負の二項分布となる。
幾何分布および負の二項分布は、待ち時間の解析や試行回数のモデル化に広く用いられる。特に負の二項分布は過分散(分散が平均より大きい)を持つデータのモデル化に有用である。
幾何分布は最初の成功までの試行回数を表し、負の二項分布は複数回の成功までの試行回数を表す一般化である。これらはベルヌーイ試行の繰り返しに基づく基本的な分布であり、待ち時間の確率モデルとして重要な役割を果たす。
Mathematics is the language with which God has written the universe.