クラメール・ラオの下界(Cramér–Rao lower bound)は、不偏推定量の分散に対する理論的な下限を与える結果であり、推定の精度の限界を示す。フィッシャー情報量は、この下界を規定する重要な量である。
確率密度関数(または確率質量関数) $f(x;\theta)$ に従う独立同分布な標本
\[X_1, X_2, \dots, X_n\]
が与えられ、母数 $\theta$ の不偏推定量 $T = T(X_1,\dots,X_n)$ を考える。
対数尤度関数を
\[\ell(\theta) = \sum_{i=1}^{n} \log f(X_i;\theta)\]
とすると、その微分
\[U(\theta) = \frac{\partial \ell(\theta)}{\partial \theta}\]
をスコア関数という。
適切な正則性条件のもとで、
\[\mathbb{E}[U(\theta)] = 0\]
が成立する。
フィッシャー情報量は、スコア関数の分散として定義される:
\[I(\theta) = \mathrm{Var}(U(\theta)) = \mathbb{E}\left[ \left( \frac{\partial}{\partial \theta} \log f(X;\theta) \right)^2 \right]\]
また、次の形でも表される:
\[I(\theta) = - \mathbb{E}\left[ \frac{\partial^2}{\partial \theta^2} \log f(X;\theta) \right]\]
独立同分布な標本に対しては、
\[I_n(\theta) = n I(\theta)\]
が成立する。
任意の不偏推定量 $T$ に対して、
\[\mathrm{Var}(T) \geq \frac{1}{I_n(\theta)}\]
が成立する。
共分散の性質とコーシー・シュワルツの不等式を用いることで、
\[\mathrm{Var}(T) \cdot \mathrm{Var}(U(\theta)) \geq \left( \mathrm{Cov}(T, U(\theta)) \right)^2\]
が得られ、さらに
\[\mathrm{Cov}(T, U(\theta)) = 1\]
が成立することから結論が導かれる。
クラメール・ラオの下界を達成する不偏推定量は効率的(efficient)であるという。
このとき、
\[\mathrm{Var}(T) = \frac{1}{I_n(\theta)}\]
が成立する。
$X_i \sim \mathcal{N}(\mu, \sigma^2)$($\sigma^2$ は既知)とすると、
\[I_n(\mu) = \frac{n}{\sigma^2}\]
より、
\[\mathrm{Var}(\bar{X}) = \frac{\sigma^2}{n} = \frac{1}{I_n(\mu)}\]
となり、標本平均は効率的推定量である。
パラメータがベクトル $\boldsymbol{\theta}$ の場合、フィッシャー情報量は行列(情報行列)となり、
\[\mathrm{Cov}(T) \succeq I(\boldsymbol{\theta})^{-1}\]
が成立する。
クラメール・ラオの下界は、不偏推定量の分散の理論的限界を与え、フィッシャー情報量はその限界を決定する。これにより、推定の精度や効率性を定量的に評価することが可能となる。
Mathematics is the language with which God has written the universe.