離散型確率分布は、確率変数が高々可算個の値をとる場合に、その分布を記述する枠組みである。離散型確率変数は確率質量関数によって完全に特徴づけられ、和によって確率が計算される点に特徴がある。
確率空間 $(\Omega, \mathcal{F}, P)$ 上の確率変数 $X : \Omega \to \mathbb{R}$ が離散型であるとは、その像集合
\[\mathcal{X} = \{x_1, x_2, \dots\}\]
が有限または可算無限集合であることをいう。
このとき、各値 $x \in \mathcal{X}$ に対して
\[p(x) = P(X = x)\]
と定義される関数 $p : \mathcal{X} \to [0,1]$ を確率質量関数(probability mass function, pmf)という。
確率質量関数は次の条件を満たす。
また、任意の部分集合 $A \subseteq \mathcal{X}$ に対して、
\[P(X \in A) = \sum_{x \in A} p(x)\]
が成立する。
離散型確率変数の累積分布関数は
\[F_X(x) = P(X \leq x) = \sum_{t \leq x} p(t)\]
によって与えられる。この関数は階段関数となり、不連続点におけるジャンプの大きさが $p(x)$ に一致する。
離散型確率変数の期待値は
\[\mathbb{E}[X] = \sum_{x \in \mathcal{X}} x\,p(x)\]
によって定義される。
分散は
\[\mathrm{Var}(X) = \sum_{x \in \mathcal{X}} (x - \mu)^2 p(x), \quad \mu = \mathbb{E}[X]\]
で与えられる。
確率 $p \in [0,1]$ に対して、
\[P(X=1)=p,\quad P(X=0)=1-p\]
で定義される分布であり、成功・失敗の二値試行を表す。
独立なベルヌーイ試行を $n$ 回行ったときの成功回数を表す。
\[P(X=k)=\binom{n}{k} p^k (1-p)^{n-k}, \quad k=0,1,\dots,n\]
一定時間内に発生する事象の回数をモデル化する。
\[P(X=k)=\frac{\lambda^k e^{-\lambda}}{k!}, \quad k=0,1,2,\dots\]
最初の成功までの試行回数を表す。
\[P(X=k)=(1-p)^{k-1}p, \quad k=1,2,\dots\]
離散型確率変数に対して、モーメント母関数は
\[M_X(t)=\mathbb{E}[e^{tX}]=\sum_{x} e^{tx} p(x)\]
として定義される。
非負整数値をとる確率変数に対しては、確率生成関数
\[G_X(s)=\mathbb{E}[s^X]=\sum_{k=0}^{\infty} s^k P(X=k)\]
が定義される。
離散型確率分布は、可算集合上で定義される確率質量関数によって特徴づけられ、和による確率計算が可能である。期待値や分散、生成関数といった解析的道具により、その性質を体系的に理解することができる。これは統計モデリングや確率過程の基礎を構成する重要な概念である。
Mathematics is the language with which God has written the universe.