ブートストラップ法

ブートストラップ法（bootstrap）は、標本データからの再標本化（resampling）により統計量の分布を近似するノンパラメトリックな手法である。母集団分布の形状を仮定せずに、推定量のばらつきや信頼区間を評価できる点に特徴がある。

基本的な考え方

観測された標本

\[X_1, X_2, \dots, X_n\]

を母集団の近似とみなし、この標本から復元抽出（with replacement）により新たな標本（ブートストラップ標本）を生成する。

得られた統計量の集合

\[\{T^*_1, T^*_2, \dots, T^*_B\}\]

を用いて、元の統計量 $T$ の標本分布を近似する。

ブートストラップ標準誤差は

\[\widehat{\mathrm{SE}}_{\mathrm{boot}} =\sqrt{\frac{1}{B-1} \sum_{b=1}^{B} \left(T^*_b - \bar{T}^*\right)^2}\]

で与えられる。

ブートストラップ分布の分位点を用いて、

\[\left( T^*_{(\alpha/2)},\; T^*_{(1-\alpha/2)} \right)\]

を信頼区間とする。

分布の歪みやバイアスを補正した方法であり、より精度の高い区間推定が可能である。

経験分布関数

\[\hat{F}_n(x) = \frac{1}{n} \sum_{i=1}^{n} \mathbf{1}_{\{X_i \leq x\}}\]

を母分布の近似とみなし、この分布からの再標本化によって標本分布を近似する。

ブートストラップ法は、標本からの再標本化により統計量の分布を近似する柔軟な手法である。理論的な分布が不明な場合や解析が困難な場合に特に有効であり、現代統計学およびデータ分析において広く利用されている。

Mathematics is the language with which God has written the universe.