一様最強検出力検定とネイマン・ピアソンの補題

投稿者: | 2017-09-03

前回の記事「仮説検定の過誤と検出力関数」では仮説検定には第一種過誤/第二種過誤があり、その二つを考慮した評価尺度として検出力関数を導入しました。通常、第一種過誤と第二種過誤はトレードオフの関係があるので

  • 第一種過誤の発生確率を高々[math]\alpha[/math]に押さえた検定(有意水準[math]\alpha[/math]の検定)に限定
  • 有意水準[math]\alpha[/math]の検定の中で第二種過誤の発生確率が低い、つまり検出力関数が大きい検定を探す

という方針で「良い仮説検定」を選択します。この方針のことを「ネイマン・ピアソンの基準」と呼びます。

一様最強検出力検定

ネイマン・ピアソンの基準に沿って考えると、有意水準[math]\alpha[/math]の仮説検定のクラス[math]C_\alpha[/math]の中で検出力関数が大きい検定が「良い検定」と言えます。この「良い検定」を定義したのが一様最強検出力検定(uniformly most powerful test, UMP test)です。

有意水準[math]\alpha[/math]である仮説検定のクラス[math]C_\alpha[/math]を考え、[math]C_\alpha[/math]の検定[math]T[/math]の検出力関数を[math]\beta(\theta)[/math]とする。[math]C_\alpha[/math]の任意の検定[math]T'[/math]の検出力関数[math]\beta'(\theta)[/math]に対し

[math]
\beta(\theta)\geq \beta'(\theta)\quad \forall \theta\in\Theta_0^c
[/math]

が成立するとき検定[math]T[/math]を一様最強検出力検定と呼ぶ。

有意水準を固定、つまり第一種過誤の発生確率を固定した上で対立仮説が正しい場合は常に(すべての[math]\theta\in\Theta_0^c[/math]で)検出力が最大(=誤って帰無仮説を採択してしまう第二種過誤が最小)になる検定を意味しておりネイマン・ピアソンの基準で最も良い検定と言えます。

一様最強検出力検定はネイマン・ピアソンの基準で「最も良い検定」といえますが、条件が強いため必ずしも一様最強検出力検定が存在するとは限りません。幸いなことにいくつかの状況では一様最強検出力検定が存在し、次に紹介する「ネイマン・ピアソンの補題」から単純仮説と呼ばれる状況では「尤度比検定」が一様最強検出力検定になることが知られています。

ネイマン・ピアソンの補題

帰無仮説、対立仮説のパラメータが1つのみ、つまり

  • [math]H_0[/math]: [math]\theta=\theta_0[/math]
  • [math]H_1[/math]: [math]\theta=\theta_1[/math]

である仮説検定を単純仮説と呼びます。[math]\theta=\theta_i(i=0, 1)[/math]の時に各標本が従う確率密度関数を[math]f(\mathbf{x}\ |\ \theta_i)[/math]とします。尤度比

[math]
\lambda(\mathbf{x})=\dfrac{f(\mathbf{x}\ |\ \theta_0)}{f(\mathbf{x}\ |\ \theta_1)}
[/math]

と定数[math]k > 0[/math]を用いて

  • [math]\lambda(\mathbf{x})\leq k[/math]ならば[math]H_0[/math]を棄却
  • [math]\lambda(\mathbf{x}) > k[/math]ならば[math]H_0[/math]を採択

する検定[math]T_L[/math]を考えます。次のネイマン・ピアソンの補題から検定[math]T_L[/math]は一様最強検出力検定になることが知られています。

単純仮説に対する検定[math]T_L[/math]は有意水準[math]\alpha(=P_{\theta_0}(\mathbf{x} \in R))[/math]の一様最強検出力検定である。

尤度比検定[math]T_L[/math]の検出力関数を[math]\beta_L(\theta)[/math]とし、有意水準[math]\alpha[/math]である任意の仮説検定[math]T\in C_\alpha[/math]の検出力関数を[math]\beta(\theta)[/math]とします。単純仮説より[math]\Theta_0^c=\{\theta_1\}[/math]なので

[math]
\beta_L(\theta_1)\geq \beta(\theta_1)
[/math]

となることを示します。検定[math]T_L,\ T[/math]の棄却域をそれぞれ[math]R_L,\ R[/math]とし、指示関数[math]\phi(\mathbf{x}|A)[/math]

[math]
\phi(\mathbf{x}|A)=\begin{cases}1&(x\in A)\\ 0&(x\notin A)\end{cases}
[/math]

を用いて関数[math]P(\mathbf{x})[/math]を

[math]
\begin{eqnarray}
P(\mathbf{x})&=&\left\{\phi(\mathbf{x}|R_L)-\phi(\mathbf{x}|R)\right\}\\
&\quad & \times\left\{f(\mathbf{x}|\theta_1)-\frac{1}{k}f(\mathbf{x}|\theta_0)\right\}
\end{eqnarray}
[/math]

で定義します。[math]\mathbf{x}\in R_L[/math], [math]\mathbf{x}\notin R_L[/math]の場合に分け

  • [math]\phi(\mathbf{x}|R_L)-\phi(\mathbf{x}|R)[/math]
  • [math]f(\mathbf{x}|\theta_1)-\frac{1}{k}f(\mathbf{x}|\theta_0)[/math]

の符号を調べる[1][math]f(\mathbf{x}|\theta_1)-\frac{1}{k}f(\mathbf{x}|\theta_0)[/math]の符号は[math]k-\lambda(\mathbf{x})[/math]の符号と一致し[math]\mathbf{x}\in … Continue readingといずれの場合も

[math]
P(\mathbf{x})\geq 0
[/math]

であることを示せます。このことから

[math]
\begin{eqnarray}
0 &\leq &\int P(\mathbf{x})d\mathbf{x} \\
&=&\int_{R_L}\left\{f(\mathbf{x}|\theta_1)-\frac{1}{k}f(\mathbf{x}|\theta_0)\right\}d\mathbf{x} \\
&\quad & -\int_{R}\left\{f(\mathbf{x}|\theta_1)-\frac{1}{k}f(\mathbf{x}|\theta_0)\right\}d\mathbf{x} \\
&=& P_{\theta_1}(\mathbf{X}\in R_L)-\frac{1}{k}P_{\theta_0}(\mathbf{X}\in R_L)\\
&\quad &-\left(P_{\theta_1}(\mathbf{X}\in R)-\frac{1}{k}P_{\theta_0}(\mathbf{X}\in R)\right) \\
&=& \beta_L(\theta_1)- \beta(\theta_1) – \frac{1}{k}\left(\beta_L(\theta_0) – \beta(\theta_0)\right)
\end{eqnarray}
[/math]

であり検定[math]T_L,\ T[/math]はともに有意水準[math]\alpha[/math]の検定なので

[math]
\beta_L(\theta_0)=\beta(\theta_0)=\alpha
[/math]

より

[math]
\begin{eqnarray}
&&0 \leq \beta_L(\theta_1)- \beta(\theta_1)\\
&\Leftrightarrow & \beta_L(\theta_1)\geq \beta(\theta_1)
\end{eqnarray}
[/math]

が成立し、検定[math]T_L[/math]は一様最強検出力検定であることが分かります。

シリーズ記事

参考文献

  • Casella, G and Berger, R.L.(1990), Statistical Inference(Second Edition): Section 8.3.2 Most Powerful Tests

脚注

脚注
1 [math]f(\mathbf{x}|\theta_1)-\frac{1}{k}f(\mathbf{x}|\theta_0)[/math]の符号は[math]k-\lambda(\mathbf{x})[/math]の符号と一致し[math]\mathbf{x}\in R_L[/math]の時に非負、それ以外の時は負になります。

スポンサーリンク


コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です