Def:binomial distribution
二項分布とは, 独立なベルヌーイ試行を $n$ 回行ったとき,成功が $k$ 回生じる確率を表す確率分布である.成功確率を $p$,失敗確率を $q = 1-p$ とすると,確率変数 $X$ が $n$ 回の試行における成功回数を表すとき,確率質量関数は,\[P(X = k) = f_X(k) = \binom{n}{k} p^k q^{\,n-k}, \quad k = 0, 1, \dots, n\]である.
確率質量関数 $f_X(k)$ が確率関数の条件を満たすことを確認する.非負性については,\[f_X(k) = \binom{n}{k} p^k q^{\,n-k} \ge 0, \quad k = 0,1,\dots,n\]が成立する.また,全確率の和は,\[\sum_{k=0}^{n} f_X(k) = \sum_{k=0}^{n} \binom{n}{k} p^k q^{\,n-k} = (p+q)^n = 1\]であり,確率質量関数の条件を満たす.
確率変数 $X$ の期待値 $E[X]$ は定義により,\[E[X] = \sum_{k=0}^{\infty} k \, P(X = k)\]である.ここで, $X$ が $n$ 回の独立なベルヌーイ試行における成功回数を表す二項分布に従うとする.成功確率を $p$, 失敗確率を $q = 1-p$ とすると, 確率質量関数は\[P(X = k) = \binom{n}{k} p^k q^{\,n-k}, \quad k = 0,1,\dots,n\]である.したがって期待値は\[E[X] = \sum_{k=0}^{n} k \binom{n}{k} p^k q^{\,n-k}\]となる.ここで恒等式 $k \binom{n}{k} = n \binom{n-1}{k-1}$ を用いると,\[E[X] = \sum_{k=1}^{n} n \binom{n-1}{k-1} p^k q^{\,n-k} = n p \sum_{k=1}^{n} \binom{n-1}{k-1} p^{\,k-1} q^{\,n-k} \]インデックスを $j = k-1$ と置換すると\[E[X] = n p \sum_{j=0}^{n-1} \binom{n-1}{j} p^j q^{\,n-1-j} = n p \sum_{j=0}^{n-1} \binom{n-1}{j} p^j q^{\, (n-1) - j } = n p (p+q)^{\,n-1} = n p\]したがって, 二項分布における期待値は\[E[X] = n p\]である.
確率変数 $X$ の分散 $\mathrm{Var}(X)$ は定義により,\[\mathrm{Var}(X) = E[(X - E[X])^2] = E[X^2] - (E[X])^2\]である.ここで, $X$ が $n$ 回の独立なベルヌーイ試行における成功回数を表す二項分布に従うとする.成功確率を $p$, 失敗確率を $q = 1-p$ とすると, 確率質量関数は\[P(X = k) = \binom{n}{k} p^k q^{\,n-k}, \quad k = 0,1,\dots,n\]である.まず $E[X^2]$ を求める.\[E[X^2] = \sum_{k=0}^{n} k^2 \binom{n}{k} p^k q^{\,n-k}= \sum_{k=0}^{n} k(k-1) \binom{n}{k} p^k q^{\,n-k} + \sum_{k=0}^{n} k \binom{n}{k} p^k q^{\,n-k}\]ここで, 恒等式 $k(k-1) \binom{n}{k} = n(n-1) \binom{n-2}{k-2}$ および先ほど求めた $E[X] = np$ を用いると\[E[X^2] = n(n-1)p^2 \sum_{k=2}^{n} \binom{n-2}{k-2} p^{\,k-2} q^{\,n-k} + np= n(n-1)p^2 (p+q)^{\,n-2} + np= n(n-1)p^2 + np\]したがって分散は\[\mathrm{Var}(X) = E[X^2] - (E[X])^2= \bigl(n(n-1)p^2 + np\bigr) - (np)^2= np(1-p) = npq\]となる.
Mathematics is the language with which God has written the universe.