汎用的な検定方法として尤度比
[math]
\lambda(\mathbf{x}) = \dfrac{\sup_{\theta\in\Theta_0}L(\theta\ |\ \mathbf{x})}{\sup_{\theta\in\Theta}L(\theta\ |\ \mathbf{x})}
[/math]
を使った「尤度比検定」を紹介しました。
ここでは
- 母集団が正規分布[math]\mathcal{N}(\mu, \sigma^2)[/math]に従う
- 分散[math]\sigma^2[/math]は未知
の場合に平均[math]\mu[/math]に関する尤度比検定は「[math]t[/math]分布を使った検定」に帰着できることを示します。なお、分散が「既知」の場合の応用編になるため「正規母集団(分散既知)の平均に関する検定の導出」も合わせてご参照ください。
問題設定
母集団が正規分布に従いその分散は未知であるとします。この母集団から無作為抽出した標本を[math]X_i(i=1,\dots,n)[/math]として平均[math]\mu[/math]に関する次の両側検定を考えます。
- [math]H_0[/math]: [math]\mu=\mu_0[/math]
- [math]H_1[/math]: [math]\mu\ne\mu_0[/math]
尤度比検定
まず、正規分布[math]\mathcal{N}(\mu, \sigma^2)[/math]の確率密度関数[math]f(x|\mu,\sigma)[/math]は
[math]
f(x|\mu,\sigma)=\dfrac{1}{\sqrt{2\pi\sigma^2}}\exp\left[-\frac{(x-\mu)^2}{2\sigma^2} \right]
[/math]
になります。なお、計算と表記をシンプルにするため平均[math]\mu[/math]と標準偏差[math]\sigma[/math]をパラメータとします。
[math]C=\frac{1}{\sqrt{2\pi}}[/math]とおくと尤度関数[math]L(\mu,\sigma|\mathbf{x})[/math]は
[math]
\begin{eqnarray}
&& L(\mu,\sigma|\mathbf{x})\\
&=& \prod_{i=1}^{n} f(x_i|\mu,\sigma) \\
&=& \dfrac{C^n}{\sigma^n} \exp\left[-\frac{1}{2\sigma^2}\sum_{i=1}^n (x_i-\mu)^2 \right]
\end{eqnarray}
[/math]
となります。
パラメータ空間[math]\Theta[/math]は
[math]
\Theta = \left\{ (\mu,\sigma)\in\mathbb{R}^2 \ |\ \sigma > 0\right\}
[/math]
になり、帰無仮説のパラメータ空間は
[math]
\Theta_0 = \left\{ (\mu,\sigma)\in\mathbb{R}^2 \ |\ \mu = \mu_0, \sigma > 0 \right\}
[/math]
となります。
尤度比[math]\lambda(\mathbf{x})[/math]は定義より
[math]
\lambda(\mathbf{x}) = \dfrac{\sup_{(\mu,\sigma)\in\Theta_0}L(\mu,\sigma\ |\ \mathbf{x})}{\sup_{(\mu,\sigma)\in\Theta}L(\mu,\sigma\ |\ \mathbf{x})}
[/math]
なので分子/分母の値を求めるために対数尤度を計算すると
[math]
\begin{eqnarray}
&& \log L(\mu,\sigma\ |\ \mathbf{x}) \\
&=& n(\log C – \log \sigma)-\frac{1}{2\sigma^2}\sum_{i=1}^n (x_i-\mu)^2
\end{eqnarray}
[/math]
になります。分母の尤度を求めるために
[math]
\begin{cases}
\dfrac{\partial (\log L)}{\partial \mu} = 0 \\
\dfrac{\partial (\log L)}{\partial \sigma} = 0
\end{cases}
[/math]
を解くと
[math]
\begin{cases}
\mu = \dfrac{1}{n}\sum_{i=1}^n x_i \\
\sigma^{2} = \dfrac{1}{n}\sum_{i=1}^n (x_i – \mu)^2
\end{cases}
[/math]
になります。つまり分母の尤度は[math]\mu, \sigma^2[/math]が標本平均[math]\bar{x}=\frac{1}{n}\sum_{i=1}^n x_i[/math], 標本分散[math]s_1^2=\frac{1}{n}\sum_{i=1}^n (x_i – \bar{x})^2[/math]に等しいときに最大値
[math]
\begin{eqnarray}
&& L(\bar{x}, s_1) \\
&=& \dfrac{C^n}{s_1^n} \exp\left[-\frac{1}{2s_1^2}\sum_{i=1}^n (x_i-\bar{x})^2 \right] \\
&=& \dfrac{C^n}{s_1^n} \exp\left[-\frac{n}{2} \right]
\end{eqnarray}
[/math]
を取ります。
次に分子を求めると[math]\mu=\mu_0[/math]と制限されていることに注意して同様に解くと
[math]
\begin{cases}
\mu = \mu_0 \\
\sigma^{2} = \dfrac{1}{n}\sum_{i=1}^n (x_i – \mu_0)^2
\end{cases}
[/math]
で最大になり[math]s_0^2=\frac{1}{n}\sum_{i=1}^n (x_i – \mu_0)^2[/math]と置くと
[math]
\begin{eqnarray}
&& L(\mu_0, s_0) \\
&=& \dfrac{C^n}{s_0^n} \exp\left[-\frac{1}{2s_0^2}\sum_{i=1}^n (x_i-\mu_0)^2 \right] \\
&=& \dfrac{C^n}{s_0^n} \exp\left[-\frac{n}{2} \right]
\end{eqnarray}
[/math]
となります。これより尤度比は
[math]
\begin{eqnarray}
&& \lambda(\mathbf{x}) \\
&=& \left( \dfrac{s_1^2}{s_0^2}\right)^{n/2} \\
&=& \left( \dfrac{\sum_{i=1}^n (x_i – \bar{x})^2}{\sum_{i=1}^{n}(x_i-\mu_0)^2}\right)^{n/2}
\end{eqnarray}
[/math]
とかけ、分母を平均[math]\bar{x}[/math]周りで展開し
[math]
\begin{eqnarray}
&&\sum_{i=1}^n (x_i-\mu_0)^2 \\
&=& \sum_{i=1}^n (x_i-\bar{x} + \bar{x}-\mu_0)^2 \\
&=& \sum_{i=1}^n (x_i-\bar{x})^2 + n (\bar{x}-\mu_0)^2
\end{eqnarray}
[/math]
となることに注意し、尤度比の逆数[math]1/\lambda(\mathbf{x})[/math]を計算すると
[math]
1+\dfrac{(\bar{x}-\mu_0)^2}{\frac{1}{n}\sum_{i=1}^n (x_i-\bar{x})^2}
[/math]
になります。さらに標本不偏分散[math]S^2=\frac{1}{n-1}\sum_{i=1}^n (x_i-\bar{x})^2[/math]を用いて
[math]
t = \dfrac{\bar{x}-\mu_0}{S/\sqrt{n}}
[/math]
とおくと
[math]
\begin{eqnarray}
&& \dfrac{1}{\lambda(\mathbf{x})} = 1 + \dfrac{t^2}{n-1}\\
&\Leftrightarrow& \lambda(\mathbf{x}) = \left(1 + \dfrac{t^2}{n-1}\right)^{-1}
\end{eqnarray}
[/math]
と書け[math]|t|[/math]の単調減少関数になっているので任意の定数[math]k > 0[/math]に対して定数[math]c > 0[/math]が存在して
[math]
\lambda(\mathbf{x}) \leq k \Leftrightarrow |t| \geq c
[/math]
が成立するので尤度比検定は次の形に書くことができます。
正規母集団(分散未知)の平均に関する検定
- 事前に有意水準[math]\alpha[/math]を決め棄却域[math]R=\left\{t\ |\ |t| \geq c_\alpha\right\}[/math] を設定する。
- 統計量[math]T=\dfrac{\bar{X}-\mu_0}{S/\sqrt{n}}[/math]を計算する。
- [math]T \in R[/math]ならば帰無仮説を棄却し、そうでないなら帰無仮説を採択する。
帰無仮説の下では[math]T=\dfrac{\bar{X}-\mu_0}{S/\sqrt{n}}[/math]は自由度[math]n-1[/math]の[math]t[/math]分布に従うことから、両側検定の場合は上側[math]100\alpha / 2\%[/math]点[math]t_{n-1}(\alpha/2)[/math]を使って棄却域[math]R[/math]を
[math]
R=\left\{t\ |\ |t| \geq t_{n-1}(\alpha/2)\right\}
[/math]
と書けます。
シリーズ記事
- 正規母集団(分散既知)の平均に関する検定の導出
- 正規母集団(分散未知)の平均に関する検定の導出(本記事)
- 正規母集団の等分散性に関する検定の導出