【統計検定1級過去問】2017年（統計数理）大問1 解答例

標本平均の平均〜尖度に関する問題が出題されました。標本平均の平均、分散は頻出問題ですが歪度、尖度を求めるのは初めてという人も多かったと思います。

特に問3は[math]E\left[\left(\sum_{i=1}^nX_i-\mu\right)^4\right][/math]を求める際に[math]E[(X_i-\mu)^4][/math]以外の項も残ることに気付きづらい難問です。他の大問と比べ量、質ともに飛び抜けて難しく「選択しないのが正解」だったのではと思うほど難しい問題セットだと思います。

問題

確率変数[math]X[/math]は母集団分布[math]D[/math]に従うとし

期待値: [math]\mu=E[X][/math]
分散: [math]\sigma^2=V[X][/math]
歪度: [math]\beta_1=\dfrac{E[(X-\mu)^3]}{\sigma^3}[/math]
尖度: [math]\beta_2=\dfrac{E[(X-\mu)^4]}{\sigma^4}-3[/math]

とする。ただし、それぞれ有限で[math]\sigma^2 > 0[/math]とする。

確率変数[math]X_1,\dots,X_n[/math]は分布[math]D[/math]に従い互いに独立であるとする。

[math]
\begin{eqnarray}
\bar{X} &=& \dfrac{1}{n}\sum_{i=1}^n X_i \\
T^2 &=& \dfrac{1}{n}\sum_{i=1}^n (X_i-\mu)^2 \\
S^2 &=& \dfrac{1}{n-1}\sum_{i=1}^n (X_i-\bar{X})^2
\end{eqnarray}
[/math]

とするとき以下の問に答えよ。

（出典：統計検定HP「統計検定 1級の過去問題」。問題文を一部略記。）

問1

[math]\bar{X}[/math]の期待値、分散を[math]\mu,\ \sigma^2,\ n[/math]を用いて表せ。また、[math]T^2,\ S^2[/math]はともに[math]\sigma^2[/math]の不偏推定量であることを示せ。

標本平均[math]\bar{X}[/math]の平均は

[math]
\begin{eqnarray}
E[\bar{X}] &=& E\left[\dfrac{1}{n}\sum_{i=1}^n X_i\right] \\
&=& \dfrac{1}{n}\sum_{i=1}^n E[X_i] \\
&=& \mu
\end{eqnarray}
[/math]

である。

[math]\bar{X}-\mu=\frac{1}{n}\sum_{i=1}^n(X_i – \mu)[/math]より分散は

[math]
\begin{eqnarray}
&& V[\bar{X}] \\
&=& E[(\bar{X} – \mu)^2] \\
&=& \dfrac{1}{n^2}E\left[\left\{\sum_{i=1}^n(X_i-\mu)\right\}^2\right]
\end{eqnarray}
[/math]

であり[math]X_i[/math]は互いに独立なので「積の期待値」は「期待値の積」になることに注意し

[math]
\begin{eqnarray}
&& E\left[\left\{\sum_{i=1}^n(X_i-\mu)\right\}^2\right] \\
&=& E\left[\sum_{i=1}^n(X_i-\mu)^2\right. \\
&&\quad \left.+\sum_{i\ne j}(X_i-\mu)(X_j – \mu)\right] \\
&=& \sum_{i=1}^nE\left[(X_i-\mu)^2\right] \\
&&\quad + \sum_{i\ne j}E\left[X_i-\mu\right]E\left[X_j – \mu\right] \\
&=& \sum_{i=1}^nV[X_i] \\
&=& n\sigma^2
\end{eqnarray}
[/math]

となる。これより[math]V[\bar{X}]=\frac{\sigma^2}{n}[/math]である。

[math]T^2[/math]の期待値を求めると

[math]
\begin{eqnarray}
E[T^2] &=& \dfrac{1}{n}\sum_{i=1}^n E[(X_i-\mu)^2] \\
&=& \dfrac{1}{n}\cdot n\sigma^2 \\
&=& \sigma^2
\end{eqnarray}
[/math]

より[math]T^2[/math]は[math]\sigma^2[/math]の不偏推定量である。

次に[math]S^2[/math]の期待値を求めると[math](X_i – \bar{X})^2[/math]を平均[math]\mu[/math]周りで展開して

[math]
\begin{eqnarray}
&& (X_i – \bar{X})^2 \\
&=& (X_i – \mu)^2 \\
&&\quad – 2(X_i – \mu)(\bar{X}-\mu) + (\bar{X} – \mu)^2 \\
&=& (X_i – \mu)^2 \\
&& \quad – \dfrac{2}{n}\sum_{j=1}^n(X_i – \mu)(X_j-\mu) + (\bar{X} – \mu)^2
\end{eqnarray}
[/math]

より

[math]
\begin{eqnarray}
&& E\left[(X_i – \bar{X})^2\right] \\
&=& \sigma^2 – \dfrac{2\sigma^2}{n} + \dfrac{\sigma^2}{n}
&=& \dfrac{n-1}{n}\sigma^2
\end{eqnarray}
[/math]

なので

[math]
\begin{eqnarray}
E[S^2] &=& \dfrac{1}{n-1}\sum_{i=1}^n E\left[(X_i-\bar{X})^2\right] \\
&=& \dfrac{1}{n-1}\cdot n \cdot \dfrac{n-1}{n}\sigma^2 \\
&=& \sigma^2
\end{eqnarray}
[/math]

より[math]S^2[/math]は[math]\sigma^2[/math]の不偏推定量である。

問2

[math]\bar{X}[/math]の歪度を[math]\beta_1,\ n[/math]を用いて表せ。

歪度は線形変換に対して不変なので[math]Z_i=\frac{X_i-\mu}{\sigma}[/math]と変換し平均[math]0[/math], 分散[math]1[/math]のケースに限定して考えると見通しが立てやすくなります。

また「和の三乗」の期待値は一度[math]n=2[/math]の時のケースを考えると

[math]
\begin{eqnarray}
&& (Z_1 + Z_2)^3 \\
&=& Z_1^3 + 3Z_1^2 Z_2 + 3Z_1 Z_2^2 + Z_2^3
\end{eqnarray}
[/math]

と展開でき、独立性と[math]E[Z_i]=0[/math]より[math]E[Z_i^3][/math]のみが残り[math]\beta_1[/math]と結びつけることができます。これを一般の[math]n[/math]場合に拡張し[math]\bar{X}[/math]の歪度を出すことができます。

定数[math]a > 0, b[/math]を用いて[math]Y=aX+b[/math]とすると[math]E[Y]=a\mu+b[/math], [math]V[Y]=a^2\sigma^2[/math]より

[math]
\begin{eqnarray}
\beta_1(Y) &=& \dfrac{E\left[(Y-E[Y])^3\right]}{\sqrt{V[Y]}^3} \\
&=& \dfrac{a^3E\left[(X-\mu)^3\right]}{a^3\sigma^3} \\
&=& \beta_1(X)
\end{eqnarray}
[/math]

なので線形変換に対して不変である。したがって、[math]Z_i=\frac{X_i-\mu}{\sigma}[/math]と変換し、平均[math]0[/math]、分散[math]1[/math]の場合を考えれば十分である。この時、[math]\beta_1=E[Z_i^3][/math]になる。

標本平均[math]\bar{Z}=\frac{1}{n}\sum_{i=1}^n Z_i[/math]は平均[math]0[/math]、分散[math]\frac{1}{n}[/math]なので

[math]
\begin{eqnarray}
\beta_1(\bar{Z}) &=& \dfrac{E\left[\left(\frac{1}{n}\sum_{i=1}^n Z_i\right)^3\right]}{\sqrt{1/n}^3} \\
&=& \dfrac{E\left[\left(\sum_{i=1}^n Z_i\right)^3\right]}{n\sqrt{n}}
\end{eqnarray}
[/math]

である。ここで[math]\left(\sum_{i=1}^n Z_i\right)^3[/math]を展開すると[math]i, j, k[/math]を互いに異なる添字として

[math]Z_i^3[/math]
[math]Z_i^2Z_j[/math]
[math]Z_iZ_jZ_k[/math]

の形の項が現れ[math]E[Z_i^2Z_j]=E[Z_i^2]E[Z_j]=0[/math]および[math]E[Z_iZ_jZ_k]=0[/math]なので[math]E[Z_i^3][/math]のみ残ることに注意すると

[math]
\begin{eqnarray}
E\left[\left(\sum_{i=1}^n Z_i\right)^3\right] &=& \sum_{i=1}^{n}E[Z_i^3] \\
&=& n\beta_1
\end{eqnarray}
[/math]

より

[math]
\begin{eqnarray}
\beta_1(\bar{X}) &=& \beta_1(\bar{Z}) \\
&=& \dfrac{\beta_1}{\sqrt{n}}
\end{eqnarray}
[/math]

である。

問3

[math]\bar{X}[/math]の尖度を[math]\beta_2,\ n[/math]を用いて表せ。

歪度と同様に尖度も線形変換に対して不変なので平均[math]0[/math], 分散[math]1[/math]のケースを考えると見通しが立てやすくなります。

また「和の四乗」の期待値は一度[math]n=2[/math]の時のケースを考えると

[math]
\begin{eqnarray}
&& (Z_1 + Z_2)^4 \\
&=& Z_1^4 + 4Z_1^3 Z_2 + 6Z_1^2Z_2^2 + 4Z_1 Z_2^3 + Z_2^4
\end{eqnarray}
[/math]

と展開できますが、期待値を取った時に[math]E[Z_i^4][/math]だけではなく[math]E[Z_1^2Z_2^2][/math]も残ることに注意しましょう。

定数[math]a > 0, b[/math]を用いて[math]Y=aX+b[/math]とすると[math]E[Y]=a\mu+b[/math], [math]V[Y]=a^2\sigma^2[/math]より

[math]
\begin{eqnarray}
\beta_2(Y) &=& \dfrac{E\left[(Y-E[Y])^4\right]}{\sqrt{V[Y]}^4}-3 \\
&=& \dfrac{a^4E\left[(X-\mu)^4\right]}{a^4\sigma^4}-3 \\
&=& \beta_2(X)
\end{eqnarray}
[/math]

なので線形変換に対して不変である。したがって、[math]Z_i=\frac{X_i-\mu}{\sigma}[/math]と変換し、平均[math]0[/math]、分散[math]1[/math]の場合を考えれば十分である。この時、[math]\beta_2=E[Z_i^4]-3[/math]になる。

標本平均[math]\bar{Z}=\frac{1}{n}\sum_{i=1}^n Z_i[/math]は平均[math]0[/math]、分散[math]\frac{1}{n}[/math]なので

[math]
\begin{eqnarray}
\beta_2(\bar{Z}) &=& \dfrac{E\left[\left(\frac{1}{n}\sum_{i=1}^n Z_i\right)^4\right]}{\sqrt{1/n}^4} – 3 \\
&=& \dfrac{E\left[\left(\sum_{i=1}^n Z_i\right)^4\right]}{n^2} – 3
\end{eqnarray}
[/math]

である。ここで[math]\left(\sum_{i=1}^n Z_i\right)^4[/math]を展開すると[math]i, j, k, l[/math]を互いに異なる添字として

[math]Z_i^4[/math]
[math]Z_i^3Z_j[/math]
[math]Z_i^2Z_j^2[/math]
[math]Z_i^2Z_jZ_k[/math]
[math]Z_iZ_jZ_kZ_l[/math]

の形の項が現れ[math]E[Z_i^3Z_j][/math], [math]E[Z_i^2Z_jZ_k][/math],[math]E[Z_iZ_jZ_kZ_l][/math]は[math]0[/math]なので[math]E[Z_i^4],\ E[Z_i^2Z_j^2][/math]のみ残ることに注意すると

[math]
\begin{eqnarray}
&& E\left[\left(\sum_{i=1}^n Z_i\right)^4\right] \\
&=& \sum_{i=1}^{n}E[Z_i^4]+\sum_{i\ne j}{}_4C_2E[Z_i^2]E[Z_j^2] \\
&=& n(\beta_2+3) + {}_nC_2\cdot{}_4C_2\cdot 1 \cdot 1 \\
&=& n(\beta_2+3) + 3n(n-1) \\
&=& n(\beta_2 + 3n)
\end{eqnarray}
[/math]

より

[math]
\begin{eqnarray}
\beta_2(\bar{X}) &=& \beta_2(\bar{Z}) \\
&=& \dfrac{n(\beta_2 + 3n)}{n^2} – 3 \\
&=& \dfrac{\beta_2}{n}
\end{eqnarray}
[/math]

である。

問4

[math]n[/math]が十分大きい時、[math]\bar{X}[/math]の歪度、尖度の振る舞いを述べよ。

[math]n\to\infty[/math]の時[math]\beta_1(\bar{X})\to 0[/math], [math]\beta_2(\bar{X})\to 0[/math]より歪度、尖度はともに[math]0[/math]に近づく。

問5

[math]X[/math]の母集団分布が正規分布[math]N(\mu,\ \sigma^2)[/math]であるとする。

[math]\mu[/math]が既知のとき、[math]\sigma^2[/math]の最尤推定量は[math]T^2[/math]になることを示せ。
[math]\mu[/math]が未知のとき、[math]\sigma^2[/math]の最尤推定量を[math]S^2[/math]を用いて表せ。

なお、[math]X[/math]の確率密度関数が[math]f(x)=\frac{1}{\sqrt{2\pi\sigma^2}}\exp\left[-\frac{(x-\mu)^2}{2\sigma^2}\right][/math]であることは既知としてよい。

[math]\mu[/math]が既知([math]\mu=\mu_0[/math])の場合

[math]X_1,\dots,X_n[/math]の観測値を[math]x_1,\dots,x_n[/math]とする。標準偏差[math]\sigma[/math]をパラメータとし、[math]C=\frac{1}{\sqrt{2\pi}}[/math]とおくと尤度関数[math]L(\sigma|\mathbf{x})[/math]は

[math]
\begin{eqnarray}
&& L(\mu | \mathbf{x})\\
&=& \prod_{i=1}^{n} f(x_i|\sigma) \\
&=& \dfrac{C^n}{\sigma^n} \exp\left[-\frac{1}{2\sigma^2}\sum_{i=1}^n (x_i-\mu_0)^2 \right]
\end{eqnarray}
[/math]

となるので対数尤度は

[math]
\begin{eqnarray}
&& \log L(\sigma\ |\ \mathbf{x}) \\
&=& n(\log C – \log \sigma)-\frac{1}{2\sigma^2}\sum_{i=1}^n (x_i-\mu_0)^2
\end{eqnarray}
[/math]

となる。ここで

[math]
\dfrac{\partial (\log L)}{\partial \sigma} = 0
[/math]

を解くと

[math]
\sigma^{2} = \dfrac{1}{n}\sum_{i=1}^n (x_i – \mu_0)^2
[/math]

を得る。よって、[math]T^2=\frac{1}{n}\sum_{i=1}^n (X_i – \mu_0)^2[/math]は[math]\sigma^2[/math]の最尤推定量である。

[math]\mu[/math]が未知の場合

[math]X_1,\dots,X_n[/math]の観測値を[math]x_1,\dots,x_n[/math]とする。平均[math]\mu[/math]と標準偏差[math]\sigma[/math]をパラメータとする。[math]C=\frac{1}{\sqrt{2\pi}}[/math]とおくと尤度関数[math]L(\mu,\sigma|\mathbf{x})[/math]は

[math]
\begin{eqnarray}
&& L(\mu,\sigma|\mathbf{x})\\
&=& \prod_{i=1}^{n} f(x_i|\mu,\sigma) \\
&=& \dfrac{C^n}{\sigma^n} \exp\left[-\frac{1}{2\sigma^2}\sum_{i=1}^n (x_i-\mu)^2 \right]
\end{eqnarray}
[/math]

となるので対数尤度は

[math]
\begin{eqnarray}
&& \log L(\mu,\sigma\ |\ \mathbf{x}) \\
&=& n(\log C – \log \sigma)-\frac{1}{2\sigma^2}\sum_{i=1}^n (x_i-\mu)^2
\end{eqnarray}
[/math]

となる。ここで、

[math]
\begin{cases}
\dfrac{\partial (\log L)}{\partial \mu} = 0 \\
\dfrac{\partial (\log L)}{\partial \sigma} = 0
\end{cases}
[/math]

を解くと

[math]
\begin{cases}
\mu = \dfrac{1}{n}\sum_{i=1}^n x_i \\
\sigma^{2} = \dfrac{1}{n}\sum_{i=1}^n (x_i – \mu)^2
\end{cases}
[/math]

を得る。これより[math]\sigma^2[/math]の最尤推定量は

[math]
\begin{eqnarray}
&& \dfrac{1}{n}\sum_{i=1}^n (X_i – \bar{X})^2 \\
&=& \dfrac{n-1}{n}S^2
\end{eqnarray}
[/math]

である。

シリーズ記事