ブートストラップ法

ブートストラップ法(bootstrap)は、標本データからの再標本化(resampling)により統計量の分布を近似するノンパラメトリックな手法である。母集団分布の形状を仮定せずに、推定量のばらつきや信頼区間を評価できる点に特徴がある。

基本的な考え方

観測された標本

\[X_1, X_2, \dots, X_n\]

を母集団の近似とみなし、この標本から復元抽出(with replacement)により新たな標本(ブートストラップ標本)を生成する。

手順

  1. 元の標本から大きさ $n$ の標本を復元抽出する
  2. その標本に対して統計量 $T^*$ を計算する
  3. この操作を $B$ 回繰り返す
  4. $T^*_1, T^*_2, \dots, T^*_B$ の分布を標本分布の近似とする

ブートストラップ分布

得られた統計量の集合

\[\{T^*_1, T^*_2, \dots, T^*_B\}\]

を用いて、元の統計量 $T$ の標本分布を近似する。

標準誤差の推定

ブートストラップ標準誤差は

\[\widehat{\mathrm{SE}}_{\mathrm{boot}} =\sqrt{\frac{1}{B-1} \sum_{b=1}^{B} \left(T^*_b - \bar{T}^*\right)^2}\]

で与えられる。

信頼区間の構成

パーセンタイル法

ブートストラップ分布の分位点を用いて、

\[\left( T^*_{(\alpha/2)},\; T^*_{(1-\alpha/2)} \right)\]

を信頼区間とする。

バイアス補正法(BC法, BCa法)

分布の歪みやバイアスを補正した方法であり、より精度の高い区間推定が可能である。

理論的背景

経験分布関数

\[\hat{F}_n(x) = \frac{1}{n} \sum_{i=1}^{n} \mathbf{1}_{\{X_i \leq x\}}\]

を母分布の近似とみなし、この分布からの再標本化によって標本分布を近似する。

利点

欠点

応用

まとめ

ブートストラップ法は、標本からの再標本化により統計量の分布を近似する柔軟な手法である。理論的な分布が不明な場合や解析が困難な場合に特に有効であり、現代統計学およびデータ分析において広く利用されている。

Mathematics is the language with which God has written the universe.





















仮説検定の枠組み(帰無仮説・対立仮説) 第1種・第2種の過誤と検出力 ネイマン・ピアソンの補題 尤度比検定 正規母集団の検定(z検定・t検定)