正規母集団(分散未知)の平均に関する検定の導出

投稿者: | 2017-12-08

汎用的な検定方法として尤度比

[math]
\lambda(\mathbf{x}) = \dfrac{\sup_{\theta\in\Theta_0}L(\theta\ |\ \mathbf{x})}{\sup_{\theta\in\Theta}L(\theta\ |\ \mathbf{x})}
[/math]

を使った「尤度比検定」を紹介しました。

ここでは

  • 母集団が正規分布[math]\mathcal{N}(\mu, \sigma^2)[/math]に従う
  • 分散[math]\sigma^2[/math]は未知

の場合に平均[math]\mu[/math]に関する尤度比検定は「[math]t[/math]分布を使った検定」に帰着できることを示します。なお、分散が「既知」の場合の応用編になるため「正規母集団(分散既知)の平均に関する検定の導出」も合わせてご参照ください。

問題設定

母集団が正規分布に従いその分散は未知であるとします。この母集団から無作為抽出した標本を[math]X_i(i=1,\dots,n)[/math]として平均[math]\mu[/math]に関する次の両側検定を考えます。

  • [math]H_0[/math]: [math]\mu=\mu_0[/math]
  • [math]H_1[/math]: [math]\mu\ne\mu_0[/math]

尤度比検定

まず、正規分布[math]\mathcal{N}(\mu, \sigma^2)[/math]の確率密度関数[math]f(x|\mu,\sigma)[/math]は

[math]
f(x|\mu,\sigma)=\dfrac{1}{\sqrt{2\pi\sigma^2}}\exp\left[-\frac{(x-\mu)^2}{2\sigma^2} \right]
[/math]

になります。なお、計算と表記をシンプルにするため平均[math]\mu[/math]と標準偏差[math]\sigma[/math]をパラメータとします。

[math]C=\frac{1}{\sqrt{2\pi}}[/math]とおくと尤度関数[math]L(\mu,\sigma|\mathbf{x})[/math]は

[math]
\begin{eqnarray}
&& L(\mu,\sigma|\mathbf{x})\\
&=& \prod_{i=1}^{n} f(x_i|\mu,\sigma) \\
&=& \dfrac{C^n}{\sigma^n} \exp\left[-\frac{1}{2\sigma^2}\sum_{i=1}^n (x_i-\mu)^2 \right]
\end{eqnarray}
[/math]

となります。

パラメータ空間[math]\Theta[/math]は

[math]
\Theta = \left\{ (\mu,\sigma)\in\mathbb{R}^2 \ |\ \sigma > 0\right\}
[/math]

になり、帰無仮説のパラメータ空間は

[math]
\Theta_0 = \left\{ (\mu,\sigma)\in\mathbb{R}^2 \ |\ \mu = \mu_0, \sigma > 0 \right\}
[/math]

となります。

尤度比[math]\lambda(\mathbf{x})[/math]は定義より

[math]
\lambda(\mathbf{x}) = \dfrac{\sup_{(\mu,\sigma)\in\Theta_0}L(\mu,\sigma\ |\ \mathbf{x})}{\sup_{(\mu,\sigma)\in\Theta}L(\mu,\sigma\ |\ \mathbf{x})}
[/math]

なので分子/分母の値を求めるために対数尤度を計算すると

[math]
\begin{eqnarray}
&& \log L(\mu,\sigma\ |\ \mathbf{x}) \\
&=& n(\log C – \log \sigma)-\frac{1}{2\sigma^2}\sum_{i=1}^n (x_i-\mu)^2
\end{eqnarray}
[/math]

になります。分母の尤度を求めるために

[math]
\begin{cases}
\dfrac{\partial (\log L)}{\partial \mu} = 0 \\
\dfrac{\partial (\log L)}{\partial \sigma} = 0
\end{cases}
[/math]

を解くと

[math]
\begin{cases}
\mu = \dfrac{1}{n}\sum_{i=1}^n x_i \\
\sigma^{2} = \dfrac{1}{n}\sum_{i=1}^n (x_i – \mu)^2
\end{cases}
[/math]

になります。つまり分母の尤度は[math]\mu, \sigma^2[/math]が標本平均[math]\bar{x}=\frac{1}{n}\sum_{i=1}^n x_i[/math], 標本分散[math]s_1^2=\frac{1}{n}\sum_{i=1}^n (x_i – \bar{x})^2[/math]に等しいときに最大値

[math]
\begin{eqnarray}
&& L(\bar{x}, s_1) \\
&=& \dfrac{C^n}{s_1^n} \exp\left[-\frac{1}{2s_1^2}\sum_{i=1}^n (x_i-\bar{x})^2 \right] \\
&=& \dfrac{C^n}{s_1^n} \exp\left[-\frac{n}{2} \right]
\end{eqnarray}
[/math]

を取ります。

次に分子を求めると[math]\mu=\mu_0[/math]と制限されていることに注意して同様に解くと

[math]
\begin{cases}
\mu = \mu_0 \\
\sigma^{2} = \dfrac{1}{n}\sum_{i=1}^n (x_i – \mu_0)^2
\end{cases}
[/math]

で最大になり[math]s_0^2=\frac{1}{n}\sum_{i=1}^n (x_i – \mu_0)^2[/math]と置くと

[math]
\begin{eqnarray}
&& L(\mu_0, s_0) \\
&=& \dfrac{C^n}{s_0^n} \exp\left[-\frac{1}{2s_0^2}\sum_{i=1}^n (x_i-\mu_0)^2 \right] \\
&=& \dfrac{C^n}{s_0^n} \exp\left[-\frac{n}{2} \right]
\end{eqnarray}
[/math]

となります。これより尤度比は

[math]
\begin{eqnarray}
&& \lambda(\mathbf{x}) \\
&=& \left( \dfrac{s_1^2}{s_0^2}\right)^{n/2} \\
&=& \left( \dfrac{\sum_{i=1}^n (x_i – \bar{x})^2}{\sum_{i=1}^{n}(x_i-\mu_0)^2}\right)^{n/2}
\end{eqnarray}
[/math]

とかけ、分母を平均[math]\bar{x}[/math]周りで展開し

[math]
\begin{eqnarray}
&&\sum_{i=1}^n (x_i-\mu_0)^2 \\
&=& \sum_{i=1}^n (x_i-\bar{x} + \bar{x}-\mu_0)^2 \\
&=& \sum_{i=1}^n (x_i-\bar{x})^2 + n (\bar{x}-\mu_0)^2
\end{eqnarray}
[/math]

となることに注意し、尤度比の逆数[math]1/\lambda(\mathbf{x})[/math]を計算すると

[math]
1+\dfrac{(\bar{x}-\mu_0)^2}{\frac{1}{n}\sum_{i=1}^n (x_i-\bar{x})^2}
[/math]

になります。さらに標本不偏分散[math]S^2=\frac{1}{n-1}\sum_{i=1}^n (x_i-\bar{x})^2[/math]を用いて

[math]
t = \dfrac{\bar{x}-\mu_0}{S/\sqrt{n}}
[/math]

とおくと

[math]
\begin{eqnarray}
&& \dfrac{1}{\lambda(\mathbf{x})} = 1 + \dfrac{t^2}{n-1}\\
&\Leftrightarrow& \lambda(\mathbf{x}) = \left(1 + \dfrac{t^2}{n-1}\right)^{-1}
\end{eqnarray}
[/math]

と書け[math]|t|[/math]の単調減少関数になっているので任意の定数[math]k > 0[/math]に対して定数[math]c > 0[/math]が存在して

[math]
\lambda(\mathbf{x}) \leq k \Leftrightarrow |t| \geq c
[/math]

が成立するので尤度比検定は次の形に書くことができます。

正規母集団(分散未知)の平均に関する検定

  1. 事前に有意水準[math]\alpha[/math]を決め棄却域[math]R=\left\{t\ |\ |t| \geq c_\alpha\right\}[/math] を設定する。
  2. 統計量[math]T=\dfrac{\bar{X}-\mu_0}{S/\sqrt{n}}[/math]を計算する。
  3. [math]T \in R[/math]ならば帰無仮説を棄却し、そうでないなら帰無仮説を採択する。

帰無仮説の下では[math]T=\dfrac{\bar{X}-\mu_0}{S/\sqrt{n}}[/math]は自由度[math]n-1[/math]の[math]t[/math]分布に従うことから、両側検定の場合は上側[math]100\alpha / 2\%[/math]点[math]t_{n-1}(\alpha/2)[/math]を使って棄却域[math]R[/math]を

[math]
R=\left\{t\ |\ |t| \geq t_{n-1}(\alpha/2)\right\}
[/math]

と書けます。

シリーズ記事

スポンサーリンク


コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です