ウィルコクソンの符号順位検定で用いる統計量[math]T^+[/math]の平均、分散を算出します。2013年の統計検定1級で[math]T^+[/math]の平均、分散を求める問題が出題されましたが、ベルヌーイ分布を使った別の統計量との対応付けが必要で一度経験していないと試験会場で自力で解決するのは難しいタイプの問題かもしれません。
ウィルコクソンの符号順位検定そのものついてはコチラを参照してもらうとして、定義をおさらいします。
- [math]z_i[/math]: [math]n[/math]個の対象の2回目の測定値と1回目の測定値の差[math](=y_i-x_i, i=1,2,\dots,n)[/math]
- [math]R_i[/math]: [math]|z_1|, |z_2|,\dots, |z_n|[/math]を小さい順に並べた時の[math]|z_i|[/math]の順位
とし、[math]z_i[/math]は互いに独立で共通の中央値[math]\theta[/math]に関して対称な分布に従うとします。さらに簡単のため[math]|z_i|\ne 0[/math]かつ[math]|z_i|[/math]はすべて異なるとします。
この検定では、
- 帰無仮説[math]H_0[/math]: 1回目と2回目には差がない、つまり[math]\theta=0[/math]
- 対立仮説[math]H_1[/math]: 2回目の方が1回目より高い、つまり[math]\theta>0[/math]
とし、ウィルコクソンの符号順位統計量[math]T^+[/math]を「2回目の方が高い対象の順位の和」、つまり[math]T^+=\displaystyle\sum_{z_i>0}R_i[/math]で定義します。
ベルヌーイ分布の和による表現
指示関数[math]I(z_i)=\begin{cases}1\ (z_i>0) \\ 0\ (z_i\leq 0)\end{cases}[/math]を用いると[math]T^+=\displaystyle\sum_{i=1}^nI(z_i)R_i[/math]と書けます。
ここで、確率[math]1/2[/math]で整数[math]k[/math]を確率[math]1/2[/math]で0をとる互いに独立な確率変数[math]X_k[/math]の和[math]U=\displaystyle\sum_{k=1}^nX_k[/math]を考えます。[math]H_0[/math]の下では[math]z_i[/math]は中央値[math]\theta=0[/math]に関して対称な分布に従うので[math]I(z_i)[/math]が1になる確率は[math]1/2[/math]で、順位[math]R_1,\dots,R_n[/math]は[math]1,\dots,n[/math]の並び替えなので任意の[math]x\in\mathbb{R}[/math]について[math]P(T^+\leq x)=P(U\leq x)[/math]が成立し統計量[math]T^+[/math]と[math]U[/math]は同じ分布に従うことが分かります。
これより[math]U[/math]の平均、分散を求めることで[math]T^+[/math]の平均、分散を求めることができます。
確率変数[math]X_k[/math]はベルヌーイ分布([math]p=1/2[/math])[1]確率[math]1/2[/math]で1、確率[math]1/2[/math]で0をとる確率分布に従う確率変数[math]B_k[/math]をつかって[math]X_k=kB_k[/math]と書けるので[math]U[/math]は独立な[math]n[/math]個のベルヌーイ分布に従う確率変数[math]B_1,\dots,B_n[/math]を使って
[math]U=\displaystyle\sum_{k=1}^nkB_k[/math]
と書けます。あとは、ベルヌーイ分布の平均[math]E[B_k]=\frac{1}{2}[/math]と分散[math]V[B_k]=\frac{1}{4}[/math]から[math]U[/math]の平均、分散を求めます。
平均
まず平均については
[math]\begin{eqnarray} E\left[U\right]
&=& E\left[\displaystyle\sum_{k=1}^nkB_k\right] \\
&=& \displaystyle\sum_{k=1}^nkE[B_k] \\
&=& \dfrac{1}{2}\displaystyle\sum_{k=1}^nk \\
&=& \dfrac{n(n+1)}{4}
\end{eqnarray} [/math]
が得られます。
分散
分散についても[math]B_k[/math]は互いに独立なので
[math]\begin{eqnarray} V\left[U\right]
&=& V\left[\displaystyle\sum_{k=1}^nkB_k\right] \\
&=& \displaystyle\sum_{k=1}^nk^2V[B_k] \\
&=& \dfrac{1}{4}\displaystyle\sum_{k=1}^nk^2 \\
&=& \dfrac{n(n+1)(2n+1)}{24}
\end{eqnarray} [/math]
が得られます。
以上よりウィルコクソンの符号順位統計量[math]T^+[/math]の平均、分散
[math]
\begin{eqnarray}
E\left[T^+\right] &=& \dfrac{n(n+1)}{4} \\
V\left[T^+\right] &=& \dfrac{n(n+1)(2n+1)}{24}
\end{eqnarray}
[/math]
が得られます。
参考文献
- Real Statistics Using Excel: Wilcoxon Signed-Ranks Test – Advanced
脚注
↑1 | 確率[math]1/2[/math]で1、確率[math]1/2[/math]で0をとる確率分布 |
---|