Definition:k-th moment
確率変数 $X$ と正の整数 $k$ に対して,k次モーメントは原点まわりのk次モーメント[raw moment]と中心化されたk次モーメント[central moment]の2種類の意味で定義される.
まず,原点まわりのk次モーメントは,\[\mu'_k:=\mathbb{E}[X^k],\]と定義される.ただし右辺は絶対値 $k$ 乗の期待値が有限である,すなわち $\mathbb{E}[|X|^k]<\infty$ のときに定義される.
中心化されたk次モーメントは\[\mu_k:=\mathbb{E}\big[(X-\mathbb{E}[X])^k\big],\]と定義される.特に $k=1$ のとき $\mu'_1=\mathbb{E}[X]$ つまり,$\mu'_1$ は期待値 $\mathbb{E}[X]$ であり,$k=2$ の中心モーメント $\mu_2$ は分散である.$\mu_2=\mathrm{Var}(X)=\mathbb{E}[X^2]-(\mathbb{E}[X])^2$ である.
離散型確率変数と連続型確率変数に対する具体的な計算式は次の通りである.離散型の場合において確率質量関数が $p(x)$ であるならば\[\mathbb{E}[X^k] = \sum_{x} x^k p(x),\]が成り立つ.連続型の場合において確率密度関数が $f(x)$ であるならば\[\mathbb{E}[X^k] = \int_{-\infty}^{\infty} x^k f(x) \, \mathrm{d}x\]が成り立つ.いずれの場合も積分[あるいは総和]が絶対収束すること.すなわち $\mathbb{E}[|X|^k] < \infty$ が存在条件である.
原点まわりのモーメントと中心モーメントの間には二項展開に基づく変換公式が存在する.すなわち平均 $\mu := \mathbb{E}[X]$ を用いると\[\begin{aligned}\mu_k &= \mathbb{E}\big[(X - \mu)^k\big] \\&= \sum_{j=0}^{k} \binom{k}{j} (-\mu)^{\,k-j} \, \mathbb{E}[X^j] \\&= \sum_{j=0}^{k} \binom{k}{j} (-\mu)^{\,k-j} \, \mu'_j,\end{aligned}\]が成り立つ.逆に原点まわりのモーメントを中心モーメントで表すにはモーメントの展開を解く必要があるが.一般にこれらは互いに線形関係で結ばれている.
モーメント生成関数[MGF]と特性関数はモーメントの導出に便利である.モーメント生成関数を\[M_X(t) := \mathbb{E}[e^{tX}]\]と定義すると.$M_X(t)$ が $t=0$ の近傍で定義されかつ級数展開が可能な場合には\[M_X(t) = \sum_{k=0}^\infty \frac{\mathbb{E}[X^k]}{k!} t^k\]が成り立ち.特に\[\mathbb{E}[X^k] = M_X^{(k)}(0)\]が成り立つ.一方.特性関数 $\varphi_X(t) := \mathbb{E}[e^{\mathrm{i}tX}]$ は常に定義される[複素値をとる]が.同様に導関数を用いて\[\varphi_X^{(k)}(0) = \mathrm{i}^k \mathbb{E}[X^k]\]となる[ただし導関数と期待値の交換を正当化するための積分可能性条件が必要である].
整数値確率変数に対しては階乗モーメント(falling factorial moments)\[\mathbb{E}\big[X^{\underline{k}}\big],\qquad X^{\underline{k}} := X(X-1)\cdots(X-k+1),\]が有用である.例えばポアソン分布 $ \mathrm{Poisson}(\lambda)$ に対しては\[\mathbb{E}\big[X^{\underline{k}}\big] = \lambda^k\]が成り立つ.原点まわりの通常のモーメントと階乗モーメントはスターリング数[第2種]$\left\{ {k\atop j} \right\}$ を用いて\[\mathbb{E}[X^k] = \sum_{j=0}^k \left\{ {k\atop j} \right\} \,\mathbb{E}\big[X^{\underline{j}}\big]\]として変換できる.
代表的な例を挙げる.ベルヌーイ分布 $X\sim\mathrm{Bernoulli}(p)$ のとき.$X\in\{0,1\}$ であるから任意の正整数 $k$ に対して\[\mathbb{E}[X^k] = p\]である.ポアソン分布 $X\sim\mathrm{Poisson}(\lambda)$ では $\mathbb{E}[X] = \lambda,\ \mathrm{Var}[X] = \lambda$ であり階乗モーメントは上に示した通りである.正規分布 $X\sim\mathcal{N}(\mu,\sigma^2)$ に対しては中心モーメントが簡潔な形をとり.任意の非負整数 $m$ に対して\[\mathbb{E}[(X-\mu)^{2m+1}] = 0,\qquad \mathbb{E}[(X-\mu)^{2m}] = \sigma^{2m}\,\frac{(2m)!}{2^m m!},\]である.逆に.標準コーシー分布のように $\mathbb{E}[|X|^k] = \infty$ となり k次モーメントが存在しない分布も存在する.
性質と注意点を述べる.偶数次の中心モーメントは常に非負であり.特に二次中心モーメントは分散であるため非負である.奇数次の中心モーメントは分布の非対称性[例えば3次中心モーメントが正なら右に裾が重い]を表現する.歪度[skewness]や尖度[kurtosis]は中心モーメントを標準化して定義され.歪度は\[\gamma_1 = \frac{\mu_3}{\sigma^3},\]尖度は\[\beta_2 = \frac{\mu_4}{\sigma^4},\]過剰尖度[excess kurtosis]は $\beta_2 - 3$ である.モーメントは母分布を特徴づける手がかりとなるが.全ての階のモーメントが有限であっても母分布が一意に決まるとは限らない[モーメント問題].ただしモーメント生成関数が原点の近傍で存在すれば.その場合はモーメントによって分布が一意に定まる.
収束に関する注意も重要である.確率変数列 $X_n$ が分布収束しても,必ずしも $\mathbb{E}[X_n^k] \to \mathbb{E}[X^k]$ が成り立つわけではない.期待値の極限交換を行うには支配収束定理や一様可積分性[uniform integrability]などの追加条件が必要である.逆に.モーメントがすべて収束することが分布収束を意味するわけでもなく.適切な条件のもとで二つの概念は結びつく.
以上を総合すると.$k$ 次モーメントは確率分布の形状を記述する基本的な量であり.存在条件.計算方法.生成関数との関係.階乗モーメントやスターリング数との関係.ならびにモーメントが示す分布的特徴[分散・歪度・尖度等]を理解することが.確率論および統計学における多くの応用において重要である.
Mathematics is the language with which God has written the universe.