ベータ分布

ベータ分布は区間 $[0,1]$ 上で定義される連続型確率分布であり、確率や割合をモデル化する際に広く用いられる。特にベイズ統計において、ベルヌーイ分布や二項分布の共役事前分布として重要な役割を果たす。

定義

パラメータ $\alpha > 0$, $\beta > 0$ に対して、確率変数 $X$ がベータ分布に従うとは、確率密度関数

\[f(x) =\begin{cases}\frac{1}{B(\alpha,\beta)} x^{\alpha - 1}(1 - x)^{\beta - 1} & (0 \leq x \leq 1) \\0 & \text{otherwise}\end{cases}\]

を満たすことをいう。このとき $X \sim \mathrm{Beta}(\alpha,\beta)$ と書く。

正規化定数 $B(\alpha,\beta)$ はベータ関数であり、

\[B(\alpha,\beta) = \int_{0}^{1} x^{\alpha - 1}(1-x)^{\beta - 1} dx\]

で定義される。

また、ガンマ関数との関係として、

\[B(\alpha,\beta) = \frac{\Gamma(\alpha)\Gamma(\beta)}{\Gamma(\alpha + \beta)}\]

が成立する。

\[\mathbb{E}[X] = \frac{\alpha}{\alpha + \beta}, \quad\mathrm{Var}(X) = \frac{\alpha \beta}{(\alpha + \beta)^2 (\alpha + \beta + 1)}\]

一般に、

\[\mathbb{E}[X^n] = \frac{\alpha(\alpha+1)\cdots(\alpha+n-1)}{(\alpha+\beta)(\alpha+\beta+1)\cdots(\alpha+\beta+n-1)}\]

が成立する。

パラメータ $\alpha, \beta$ の値により分布の形状は大きく変化する。

独立なガンマ分布に従う確率変数

\[X \sim \mathrm{Gamma}(\alpha,1), \quad Y \sim \mathrm{Gamma}(\beta,1)\]

に対して、

\[\frac{X}{X+Y} \sim \mathrm{Beta}(\alpha,\beta)\]

が成立する。

ベルヌーイ分布または二項分布の成功確率 $p$ に対する事前分布としてベータ分布を用いると、事後分布もベータ分布となる（共役性）。

例えば、成功回数 $k$、試行回数 $n$ に対して、

\[p \mid \text{data} \sim \mathrm{Beta}(\alpha + k, \beta + n - k)\]

となる。

ベータ分布のモーメント母関数は初等関数では表されず、超幾何関数を用いて表現される。

ベータ分布は確率や割合のモデリング、ベイズ推論、機械学習におけるパラメータ推定などで広く利用される。

ベータ分布は区間 $[0,1]$ 上で定義される柔軟な分布であり、パラメータによって多様な形状を表現できる。特にベイズ統計において共役事前分布として重要であり、他の分布との関係も豊富である。

Mathematics is the language with which God has written the universe.