ベータ分布は区間 $[0,1]$ 上で定義される連続型確率分布であり、確率や割合をモデル化する際に広く用いられる。特にベイズ統計において、ベルヌーイ分布や二項分布の共役事前分布として重要な役割を果たす。
パラメータ $\alpha > 0$, $\beta > 0$ に対して、確率変数 $X$ がベータ分布に従うとは、確率密度関数
\[f(x) =\begin{cases}\frac{1}{B(\alpha,\beta)} x^{\alpha - 1}(1 - x)^{\beta - 1} & (0 \leq x \leq 1) \\0 & \text{otherwise}\end{cases}\]
を満たすことをいう。このとき $X \sim \mathrm{Beta}(\alpha,\beta)$ と書く。
正規化定数 $B(\alpha,\beta)$ はベータ関数であり、
\[B(\alpha,\beta) = \int_{0}^{1} x^{\alpha - 1}(1-x)^{\beta - 1} dx\]
で定義される。
また、ガンマ関数との関係として、
\[B(\alpha,\beta) = \frac{\Gamma(\alpha)\Gamma(\beta)}{\Gamma(\alpha + \beta)}\]
が成立する。
\[\mathbb{E}[X] = \frac{\alpha}{\alpha + \beta}, \quad\mathrm{Var}(X) = \frac{\alpha \beta}{(\alpha + \beta)^2 (\alpha + \beta + 1)}\]
一般に、
\[\mathbb{E}[X^n] = \frac{\alpha(\alpha+1)\cdots(\alpha+n-1)}{(\alpha+\beta)(\alpha+\beta+1)\cdots(\alpha+\beta+n-1)}\]
が成立する。
パラメータ $\alpha, \beta$ の値により分布の形状は大きく変化する。
独立なガンマ分布に従う確率変数
\[X \sim \mathrm{Gamma}(\alpha,1), \quad Y \sim \mathrm{Gamma}(\beta,1)\]
に対して、
\[\frac{X}{X+Y} \sim \mathrm{Beta}(\alpha,\beta)\]
が成立する。
ベルヌーイ分布または二項分布の成功確率 $p$ に対する事前分布としてベータ分布を用いると、事後分布もベータ分布となる(共役性)。
例えば、成功回数 $k$、試行回数 $n$ に対して、
\[p \mid \text{data} \sim \mathrm{Beta}(\alpha + k, \beta + n - k)\]
となる。
ベータ分布のモーメント母関数は初等関数では表されず、超幾何関数を用いて表現される。
ベータ分布は確率や割合のモデリング、ベイズ推論、機械学習におけるパラメータ推定などで広く利用される。
ベータ分布は区間 $[0,1]$ 上で定義される柔軟な分布であり、パラメータによって多様な形状を表現できる。特にベイズ統計において共役事前分布として重要であり、他の分布との関係も豊富である。
Mathematics is the language with which God has written the universe.