符号検定・ウィルコクソン検定

符号検定およびウィルコクソン検定は、正規性の仮定を必要としないノンパラメトリック検定である。観測値の大きさではなく符号や順位に基づいて検定統計量を構成し、分布に関する仮定が弱い状況でも妥当な推測を可能にする。

設定

独立同分布な標本

\[X_1, X_2, \dots, X_n \sim F\]

を考える。$F$ は連続分布とし、中央値を $m$ とおく。帰無仮説

\[H_0 : m = m_0\]

を検定する。対立仮説は両側 $H_1 : m \neq m_0$、または片側 $H_1 : m > m_0$、$H_1 : m < m_0$ の形をとる。

符号検定

検定統計量の構成

各観測値に対して符号指示変数

\[S_i = \mathbf{1}(X_i > m_0)\]

を定義する。$X_i = m_0$ となる観測値（タイ）は除外し、有効標本サイズを $n'$ とおく。帰無仮説のもとでは $P(X_i > m_0) = 1/2$ であるから、

\[T^+ = \sum_{i=1}^{n'} S_i \sim \text{Binomial}(n',\, 1/2)\]

が成立する。

棄却域

両側検定では、二項分布の対称性から

\[T^+ \leq c_L \quad または \quad T^+ \geq c_U\]

のとき帰無仮説を棄却する。臨界値 $c_L$、$c_U$ は $\text{Binomial}(n', 1/2)$ の分位点から定める。

正規近似

$n'$ が大きい場合、中心極限定理により

\[Z = \frac{T^+ - n'/2}{\sqrt{n'/4}} \sim \mathcal{N}(0,1)\]

で近似できる。連続修正を施す場合は $T^+$ を $T^+ \pm 1/2$ に置き換える。

符号検定の特徴

観測値の符号のみを用い、大きさの情報を捨てるため、外れ値に対して頑健である
仮定が極めて弱い反面、検出力は低い
タイが多い場合や順序尺度データにも適用できる

ウィルコクソン符号順位検定

検定統計量の構成

差 $D_i = X_i - m_0$ を計算し、$D_i = 0$ のタイを除外する。残りの $n'$ 個の $|D_i|$ に順位をつけ、$R_i$ を $|D_i|$ の順位とする。符号付き順位統計量を

\[W^+ = \sum_{i=1}^{n'} R_i \cdot \mathbf{1}(D_i > 0)\]

と定義する。$W^+$ は正の差に対応する順位の和であり、符号と大きさの両方の情報を用いる。

帰無分布

帰無仮説のもとで $F$ が $m_0$ について対称であれば、各 $D_i$ の符号は等確率で正負をとり独立である。このとき $W^+$ の期待値と分散は

\[E[W^+] = \frac{n'(n'+1)}{4}, \quad \text{Var}(W^+) = \frac{n'(n'+1)(2n'+1)}{24}\]

となる。小標本では $W^+$ の厳密分布を用い、大標本では正規近似

\[Z = \frac{W^+ - E[W^+]}{\sqrt{\text{Var}(W^+)}} \sim \mathcal{N}(0,1)\]

を用いる。

棄却域

両側検定では、$W^+$ が極端に大きいまたは小さいとき帰無仮説を棄却する。正規近似のもとでは

\[|Z| > z_{\alpha/2}\]

を棄却域とする。

タイの処理

$|D_i|$ に同順位が存在する場合、タイに対して平均順位を割り当てる。このとき分散の修正項として

\[\text{Var}(W^+) = \frac{n'(n'+1)(2n'+1)}{24} - \frac{1}{48}\sum_g t_g(t_g^2 - 1)\]

を用いる。ここで $t_g$ はグループ $g$ 内のタイの個数である。

二標本への拡張：ウィルコクソン順位和検定

設定と検定統計量

二つの独立な標本

\[X_1, \dots, X_m \sim F_X, \quad Y_1, \dots, Y_n \sim F_Y\]

に対して、$H_0 : F_X = F_Y$ を検定する。合併した $m + n$ 個の観測値に順位をつけ、$X$ 標本の順位和を

\[W = \sum_{i=1}^m R_i\]

とおく。帰無仮説のもとで、

\[E[W] = \frac{m(m+n+1)}{2}, \quad \text{Var}(W) = \frac{mn(m+n+1)}{12}\]

が成立する。これはマン・ホイットニーのU統計量

\[U = W - \frac{m(m+1)}{2}\]

と等価であり、$U$ は $X_i > Y_j$ となるペアの個数を表す。

各検定の比較

符号検定は仮定が最も弱いが検出力が低く、ウィルコクソン検定は順位情報を用いることで検出力が高い
正規母集団においてt検定と比較したとき、ウィルコクソン符号順位検定の漸近相対効率は $3/\pi \approx 0.955$ であり、t検定に対してほぼ遜色ない
重裾分布や外れ値が存在する場合、ウィルコクソン検定はt検定より高い検出力を示すことがある

まとめ

符号検定は二項分布に基づき中央値の検定を行う最も単純なノンパラメトリック検定であり、外れ値への頑健性が高い。ウィルコクソン符号順位検定は差の順位も利用することで検出力を高め、正規母集団においてもt検定に匹敵する効率を持つ。二標本の場合はウィルコクソン順位和検定（マン・ホイットニー検定）へと自然に拡張される。

Mathematics is the language with which God has written the universe.

順位相関コルモゴロフ・スミルノフ検定カーネル密度推定多変量正規分布主成分分析