ウィルコクソンの符号順位検定(Wilcoxon signed-rank test)

投稿者: | 2017-04-21

ウィルコクソンの符号順位検定とは

同一の[math]n[/math]個の対象に対して2回の観察を行い1回目と2回目とで代表値に差が生じているかを調べる際に用いる検定です。例えば[math]n[/math]人の対象者に省エネ活動の指導を行いその前後での意識調査の結果を比較するなど、同一の集団に対して何らかの介入を行った前後で差が生じたかを調べたい時に使います。

他の検定方法との比較した時の特徴として

  • 同一の対象に対して行った2回の観察データを使う
  • 1回目の2回目の差の分布が正規分布以外でも適用可能
  • 順位を使うため外れ値に対して頑健

があり、正規分布性が仮定できず[math]t[/math]検定が適用できないケースで良く使われる検定方法です。

検定方法

[math]i[/math]番目の対象の1回目の測定値を[math]x_i[/math], 2回目の測定値を[math]y_i[/math]とします。1回目と2回目の比較をしたいので2回目と1回目の差を[math]z_i=y_i-x_i[/math]とし、[math]z_i[/math]は以下を満たすとします。

  • [math]z_i[/math]は互いに独立
  • [math]z_i[/math]は共通の中央値[math]\theta[/math]に関して対称な分布に従う

ここからは

  • 帰無仮説[math]H_0[/math]: 1回目と2回目には差がない、つまり[math]\theta=0[/math]
  • 対立仮説[math]H_1[/math]: 2回目の方が1回目より高い、つまり[math]\theta>0[/math]

とし、有意水準を[math]p[/math]とします。

この検定では絶対値[math]|z_1|, |z_2|,\dots, |z_n|[/math]を小さい順に並べた時の[math]|z_i|[/math]の順位[math]R_i[/math]を使って検定を行います。この記事では簡単のため[math]|z_i|\ne 0[/math]かつ[math]|z_i|[/math]はすべて異なるとします。

統計量[math]T^+[/math]を「2回目の方が高い対象の順位の和」

[math]T^+=\displaystyle\sum_{z_i>0}R_i[/math]

で定義し、この統計量を「ウィルコクソンの符号順位統計量」と呼びます。

仮に帰無仮説[math]\theta=0[/math]が正しいとすると順位[math]1, 2, 3, \dots[/math]に対応する[math]z_i[/math]の符号はバラバラでざっくり交互に現れてくるようなイメージなので[math]z_i>0[/math]の順位の和をとるとすべての順位の和[math]1+2+\dots+n=\frac{n(n+1)}{2}[/math]の半分くらいになるはずで、そこから大きくずれるようならば帰無仮説が間違っているのだろうと考えます。具体的には測定したデータでの順位和[math]S[/math]に対し

[math]P(T^+\geq S)[/math]

を数え上げて計算し、有意水準[math]p[/math]以下であれば帰無仮説を棄却します。

適用例

7人に対し省エネ活動の指導を行った前後で意識調査を行ったところ、指導前後のスコア[math](x_i, y_i)[/math]は[math](65,66), (77,83), (56,58), (88,96), (91,96), (65,60), (78,82)[/math]となった。指導前後でスコアに差があったと言えるだろうか?(有意水準[math]p=5\%[/math])

この例では[math]z_i[/math]は[math]+1, +6, +2, +8, -5, +7, +4[/math]になり[math]R_i[/math]は[math]1,5,2,7,4,6,3[/math]になります。[math]z_i>0[/math]である対象者の順位を合計すると[math]S=1+5+2+7+6+3=24[/math]であり[math]P(T^+\geq 24)=\frac{7}{128}=0.055>0.05[/math]より棄却できず有意な差があるとは言えない。

この例で分かるとおり[math]n[/math]が小さいとかなり偏ったように見える結果であっても棄却できないことがわかります[1] … Continue reading。また、[math]P(T^+\geq S)[/math]を数え上げて計算するのは[math]n[/math]が大きくなるとかなり煩雑になるため次の近似評価が良く用いられます。

ウィルコクソンの符号順位統計量[math]T^+[/math]の正規分布近似

[math]H_0[/math]の下で[math]T^+[/math]の平均、分散は以下になることが知られています。

[math]H_0[/math]の下で以下が成立する。

[math]E\left[T^+\right]=\dfrac{n(n+1)}{4}, V\left[T^+\right]=\dfrac{n(n+1)(2n+1)}{24}[/math]

平均、分散の算出方法は別記事にしてあるので興味のある方はご参照ください。

さらに[math]n[/math]が大きいと[math]T^+[/math]は正規分布[math]\mathcal{N}\left(\frac{n(n+1)}{4}, \frac{n(n+1)(2n+1)}{24}\right)[/math]に近似的に従うことも知られており、概ね[math]n> 10[/math]の時は正規分布近似を使った検定を行うようです。

参考文献

脚注

脚注
1 そもそも棄却域が存在しないこともあります。有意水準5%とした時に棄却域が存在する最小の[math]n[/math]を問う問題が2013年の統計検定1級で出題されています。

スポンサーリンク


コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です