【統計検定1級過去問】2017年(統計数理)大問1 解答例

投稿者: | 2018-02-03

コメント

標本平均の平均〜尖度に関する問題が出題されました。標本平均の平均、分散は頻出問題ですが歪度、尖度を求めるのは初めてという人も多かったと思います。

特に問3は[math]E\left[\left(\sum_{i=1}^nX_i-\mu\right)^4\right][/math]を求める際に[math]E[(X_i-\mu)^4][/math]以外の項も残ることに気付きづらい難問です。他の大問と比べ量、質ともに飛び抜けて難しく「選択しないのが正解」だったのではと思うほど難しい問題セットだと思います。

問題

確率変数[math]X[/math]は母集団分布[math]D[/math]に従うとし

  • 期待値: [math]\mu=E[X][/math]
  • 分散: [math]\sigma^2=V[X][/math]
  • 歪度: [math]\beta_1=\dfrac{E[(X-\mu)^3]}{\sigma^3}[/math]
  • 尖度: [math]\beta_2=\dfrac{E[(X-\mu)^4]}{\sigma^4}-3[/math]

とする。ただし、それぞれ有限で[math]\sigma^2 > 0[/math]とする。

確率変数[math]X_1,\dots,X_n[/math]は分布[math]D[/math]に従い互いに独立であるとする。

[math]
\begin{eqnarray}
\bar{X} &=& \dfrac{1}{n}\sum_{i=1}^n X_i \\
T^2 &=& \dfrac{1}{n}\sum_{i=1}^n (X_i-\mu)^2 \\
S^2 &=& \dfrac{1}{n-1}\sum_{i=1}^n (X_i-\bar{X})^2
\end{eqnarray}
[/math]

とするとき以下の問に答えよ。

(出典:統計検定HP「統計検定 1級の過去問題」。問題文を一部略記。)

問1

[math]\bar{X}[/math]の期待値、分散を[math]\mu,\ \sigma^2,\ n[/math]を用いて表せ。また、[math]T^2,\ S^2[/math]はともに[math]\sigma^2[/math]の不偏推定量であることを示せ。

標本平均[math]\bar{X}[/math]の平均は

[math]
\begin{eqnarray}
E[\bar{X}] &=& E\left[\dfrac{1}{n}\sum_{i=1}^n X_i\right] \\
&=& \dfrac{1}{n}\sum_{i=1}^n E[X_i] \\
&=& \mu
\end{eqnarray}
[/math]

である。

[math]\bar{X}-\mu=\frac{1}{n}\sum_{i=1}^n(X_i – \mu)[/math]より分散は

[math]
\begin{eqnarray}
&& V[\bar{X}] \\
&=& E[(\bar{X} – \mu)^2] \\
&=& \dfrac{1}{n^2}E\left[\left\{\sum_{i=1}^n(X_i-\mu)\right\}^2\right]
\end{eqnarray}
[/math]

であり[math]X_i[/math]は互いに独立なので「積の期待値」は「期待値の積」になることに注意し

[math]
\begin{eqnarray}
&& E\left[\left\{\sum_{i=1}^n(X_i-\mu)\right\}^2\right] \\
&=& E\left[\sum_{i=1}^n(X_i-\mu)^2\right. \\
&&\quad \left.+\sum_{i\ne j}(X_i-\mu)(X_j – \mu)\right] \\
&=& \sum_{i=1}^nE\left[(X_i-\mu)^2\right] \\
&&\quad + \sum_{i\ne j}E\left[X_i-\mu\right]E\left[X_j – \mu\right] \\
&=& \sum_{i=1}^nV[X_i] \\
&=& n\sigma^2
\end{eqnarray}
[/math]

となる。これより[math]V[\bar{X}]=\frac{\sigma^2}{n}[/math]である。

[math]T^2[/math]の期待値を求めると

[math]
\begin{eqnarray}
E[T^2] &=& \dfrac{1}{n}\sum_{i=1}^n E[(X_i-\mu)^2] \\
&=& \dfrac{1}{n}\cdot n\sigma^2 \\
&=& \sigma^2
\end{eqnarray}
[/math]

より[math]T^2[/math]は[math]\sigma^2[/math]の不偏推定量である。

次に[math]S^2[/math]の期待値を求めると[math](X_i – \bar{X})^2[/math]を平均[math]\mu[/math]周りで展開して

[math]
\begin{eqnarray}
&& (X_i – \bar{X})^2 \\
&=& (X_i – \mu)^2 \\
&&\quad – 2(X_i – \mu)(\bar{X}-\mu) + (\bar{X} – \mu)^2 \\
&=& (X_i – \mu)^2 \\
&& \quad – \dfrac{2}{n}\sum_{j=1}^n(X_i – \mu)(X_j-\mu) + (\bar{X} – \mu)^2
\end{eqnarray}
[/math]

より

[math]
\begin{eqnarray}
&& E\left[(X_i – \bar{X})^2\right] \\
&=& \sigma^2 – \dfrac{2\sigma^2}{n} + \dfrac{\sigma^2}{n}
&=& \dfrac{n-1}{n}\sigma^2
\end{eqnarray}
[/math]

なので

[math]
\begin{eqnarray}
E[S^2] &=& \dfrac{1}{n-1}\sum_{i=1}^n E\left[(X_i-\bar{X})^2\right] \\
&=& \dfrac{1}{n-1}\cdot n \cdot \dfrac{n-1}{n}\sigma^2 \\
&=& \sigma^2
\end{eqnarray}
[/math]

より[math]S^2[/math]は[math]\sigma^2[/math]の不偏推定量である。

問2

[math]\bar{X}[/math]の歪度を[math]\beta_1,\ n[/math]を用いて表せ。
歪度は線形変換に対して不変なので[math]Z_i=\frac{X_i-\mu}{\sigma}[/math]と変換し平均[math]0[/math], 分散[math]1[/math]のケースに限定して考えると見通しが立てやすくなります。

また「和の三乗」の期待値は一度[math]n=2[/math]の時のケースを考えると

[math]
\begin{eqnarray}
&& (Z_1 + Z_2)^3 \\
&=& Z_1^3 + 3Z_1^2 Z_2 + 3Z_1 Z_2^2 + Z_2^3
\end{eqnarray}
[/math]

と展開でき、独立性と[math]E[Z_i]=0[/math]より[math]E[Z_i^3][/math]のみが残り[math]\beta_1[/math]と結びつけることができます。これを一般の[math]n[/math]場合に拡張し[math]\bar{X}[/math]の歪度を出すことができます。

定数[math]a > 0, b[/math]を用いて[math]Y=aX+b[/math]とすると[math]E[Y]=a\mu+b[/math], [math]V[Y]=a^2\sigma^2[/math]より

[math]
\begin{eqnarray}
\beta_1(Y) &=& \dfrac{E\left[(Y-E[Y])^3\right]}{\sqrt{V[Y]}^3} \\
&=& \dfrac{a^3E\left[(X-\mu)^3\right]}{a^3\sigma^3} \\
&=& \beta_1(X)
\end{eqnarray}
[/math]

なので線形変換に対して不変である。したがって、[math]Z_i=\frac{X_i-\mu}{\sigma}[/math]と変換し、平均[math]0[/math]、分散[math]1[/math]の場合を考えれば十分である。この時、[math]\beta_1=E[Z_i^3][/math]になる。

標本平均[math]\bar{Z}=\frac{1}{n}\sum_{i=1}^n Z_i[/math]は平均[math]0[/math]、分散[math]\frac{1}{n}[/math]なので

[math]
\begin{eqnarray}
\beta_1(\bar{Z}) &=& \dfrac{E\left[\left(\frac{1}{n}\sum_{i=1}^n Z_i\right)^3\right]}{\sqrt{1/n}^3} \\
&=& \dfrac{E\left[\left(\sum_{i=1}^n Z_i\right)^3\right]}{n\sqrt{n}}
\end{eqnarray}
[/math]

である。ここで[math]\left(\sum_{i=1}^n Z_i\right)^3[/math]を展開すると[math]i, j, k[/math]を互いに異なる添字として

  • [math]Z_i^3[/math]
  • [math]Z_i^2Z_j[/math]
  • [math]Z_iZ_jZ_k[/math]

の形の項が現れ[math]E[Z_i^2Z_j]=E[Z_i^2]E[Z_j]=0[/math]および[math]E[Z_iZ_jZ_k]=0[/math]なので[math]E[Z_i^3][/math]のみ残ることに注意すると

[math]
\begin{eqnarray}
E\left[\left(\sum_{i=1}^n Z_i\right)^3\right] &=& \sum_{i=1}^{n}E[Z_i^3] \\
&=& n\beta_1
\end{eqnarray}
[/math]

より

[math]
\begin{eqnarray}
\beta_1(\bar{X}) &=& \beta_1(\bar{Z}) \\
&=& \dfrac{\beta_1}{\sqrt{n}}
\end{eqnarray}
[/math]

である。

問3

[math]\bar{X}[/math]の尖度を[math]\beta_2,\ n[/math]を用いて表せ。
歪度と同様に尖度も線形変換に対して不変なので平均[math]0[/math], 分散[math]1[/math]のケースを考えると見通しが立てやすくなります。

また「和の四乗」の期待値は一度[math]n=2[/math]の時のケースを考えると

[math]
\begin{eqnarray}
&& (Z_1 + Z_2)^4 \\
&=& Z_1^4 + 4Z_1^3 Z_2 + 6Z_1^2Z_2^2 + 4Z_1 Z_2^3 + Z_2^4
\end{eqnarray}
[/math]

と展開できますが、期待値を取った時に[math]E[Z_i^4][/math]だけではなく[math]E[Z_1^2Z_2^2][/math]も残ることに注意しましょう。

定数[math]a > 0, b[/math]を用いて[math]Y=aX+b[/math]とすると[math]E[Y]=a\mu+b[/math], [math]V[Y]=a^2\sigma^2[/math]より

[math]
\begin{eqnarray}
\beta_2(Y) &=& \dfrac{E\left[(Y-E[Y])^4\right]}{\sqrt{V[Y]}^4}-3 \\
&=& \dfrac{a^4E\left[(X-\mu)^4\right]}{a^4\sigma^4}-3 \\
&=& \beta_2(X)
\end{eqnarray}
[/math]

なので線形変換に対して不変である。したがって、[math]Z_i=\frac{X_i-\mu}{\sigma}[/math]と変換し、平均[math]0[/math]、分散[math]1[/math]の場合を考えれば十分である。この時、[math]\beta_2=E[Z_i^4]-3[/math]になる。

標本平均[math]\bar{Z}=\frac{1}{n}\sum_{i=1}^n Z_i[/math]は平均[math]0[/math]、分散[math]\frac{1}{n}[/math]なので

[math]
\begin{eqnarray}
\beta_2(\bar{Z}) &=& \dfrac{E\left[\left(\frac{1}{n}\sum_{i=1}^n Z_i\right)^4\right]}{\sqrt{1/n}^4} – 3 \\
&=& \dfrac{E\left[\left(\sum_{i=1}^n Z_i\right)^4\right]}{n^2} – 3
\end{eqnarray}
[/math]

である。ここで[math]\left(\sum_{i=1}^n Z_i\right)^4[/math]を展開すると[math]i, j, k, l[/math]を互いに異なる添字として

  • [math]Z_i^4[/math]
  • [math]Z_i^3Z_j[/math]
  • [math]Z_i^2Z_j^2[/math]
  • [math]Z_i^2Z_jZ_k[/math]
  • [math]Z_iZ_jZ_kZ_l[/math]

の形の項が現れ[math]E[Z_i^3Z_j][/math], [math]E[Z_i^2Z_jZ_k][/math],[math]E[Z_iZ_jZ_kZ_l][/math]は[math]0[/math]なので[math]E[Z_i^4],\ E[Z_i^2Z_j^2][/math]のみ残ることに注意すると

[math]
\begin{eqnarray}
&& E\left[\left(\sum_{i=1}^n Z_i\right)^4\right] \\
&=& \sum_{i=1}^{n}E[Z_i^4]+\sum_{i\ne j}{}_4C_2E[Z_i^2]E[Z_j^2] \\
&=& n(\beta_2+3) + {}_nC_2\cdot{}_4C_2\cdot 1 \cdot 1 \\
&=& n(\beta_2+3) + 3n(n-1) \\
&=& n(\beta_2 + 3n)
\end{eqnarray}
[/math]

より

[math]
\begin{eqnarray}
\beta_2(\bar{X}) &=& \beta_2(\bar{Z}) \\
&=& \dfrac{n(\beta_2 + 3n)}{n^2} – 3 \\
&=& \dfrac{\beta_2}{n}
\end{eqnarray}
[/math]

である。

問4

[math]n[/math]が十分大きい時、[math]\bar{X}[/math]の歪度、尖度の振る舞いを述べよ。

[math]n\to\infty[/math]の時[math]\beta_1(\bar{X})\to 0[/math], [math]\beta_2(\bar{X})\to 0[/math]より歪度、尖度はともに[math]0[/math]に近づく。

問5

[math]X[/math]の母集団分布が正規分布[math]N(\mu,\ \sigma^2)[/math]であるとする。

  • [math]\mu[/math]が既知のとき、[math]\sigma^2[/math]の最尤推定量は[math]T^2[/math]になることを示せ。
  • [math]\mu[/math]が未知のとき、[math]\sigma^2[/math]の最尤推定量を[math]S^2[/math]を用いて表せ。

なお、[math]X[/math]の確率密度関数が[math]f(x)=\frac{1}{\sqrt{2\pi\sigma^2}}\exp\left[-\frac{(x-\mu)^2}{2\sigma^2}\right][/math]であることは既知としてよい。

[math]\mu[/math]が既知([math]\mu=\mu_0[/math])の場合

[math]X_1,\dots,X_n[/math]の観測値を[math]x_1,\dots,x_n[/math]とする。標準偏差[math]\sigma[/math]をパラメータとし、[math]C=\frac{1}{\sqrt{2\pi}}[/math]とおくと尤度関数[math]L(\sigma|\mathbf{x})[/math]は

[math]
\begin{eqnarray}
&& L(\mu | \mathbf{x})\\
&=& \prod_{i=1}^{n} f(x_i|\sigma) \\
&=& \dfrac{C^n}{\sigma^n} \exp\left[-\frac{1}{2\sigma^2}\sum_{i=1}^n (x_i-\mu_0)^2 \right]
\end{eqnarray}
[/math]

となるので対数尤度は

[math]
\begin{eqnarray}
&& \log L(\sigma\ |\ \mathbf{x}) \\
&=& n(\log C – \log \sigma)-\frac{1}{2\sigma^2}\sum_{i=1}^n (x_i-\mu_0)^2
\end{eqnarray}
[/math]

となる。ここで

[math]
\dfrac{\partial (\log L)}{\partial \sigma} = 0
[/math]

を解くと

[math]
\sigma^{2} = \dfrac{1}{n}\sum_{i=1}^n (x_i – \mu_0)^2
[/math]

を得る。よって、[math]T^2=\frac{1}{n}\sum_{i=1}^n (X_i – \mu_0)^2[/math]は[math]\sigma^2[/math]の最尤推定量である。

[math]\mu[/math]が未知の場合

[math]X_1,\dots,X_n[/math]の観測値を[math]x_1,\dots,x_n[/math]とする。平均[math]\mu[/math]と標準偏差[math]\sigma[/math]をパラメータとする。[math]C=\frac{1}{\sqrt{2\pi}}[/math]とおくと尤度関数[math]L(\mu,\sigma|\mathbf{x})[/math]は

[math]
\begin{eqnarray}
&& L(\mu,\sigma|\mathbf{x})\\
&=& \prod_{i=1}^{n} f(x_i|\mu,\sigma) \\
&=& \dfrac{C^n}{\sigma^n} \exp\left[-\frac{1}{2\sigma^2}\sum_{i=1}^n (x_i-\mu)^2 \right]
\end{eqnarray}
[/math]

となるので対数尤度は

[math]
\begin{eqnarray}
&& \log L(\mu,\sigma\ |\ \mathbf{x}) \\
&=& n(\log C – \log \sigma)-\frac{1}{2\sigma^2}\sum_{i=1}^n (x_i-\mu)^2
\end{eqnarray}
[/math]

となる。ここで、

[math]
\begin{cases}
\dfrac{\partial (\log L)}{\partial \mu} = 0 \\
\dfrac{\partial (\log L)}{\partial \sigma} = 0
\end{cases}
[/math]

を解くと

[math]
\begin{cases}
\mu = \dfrac{1}{n}\sum_{i=1}^n x_i \\
\sigma^{2} = \dfrac{1}{n}\sum_{i=1}^n (x_i – \mu)^2
\end{cases}
[/math]

を得る。これより[math]\sigma^2[/math]の最尤推定量は

[math]
\begin{eqnarray}
&& \dfrac{1}{n}\sum_{i=1}^n (X_i – \bar{X})^2 \\
&=& \dfrac{n-1}{n}S^2
\end{eqnarray}
[/math]

である。

シリーズ記事

スポンサーリンク


【統計検定1級過去問】2017年(統計数理)大問1 解答例」への2件のフィードバック

  1. kwkm

    大変詳しい解説ありがとうございます。私の知識不足で恐縮ですが、問2、問3で出てくる和集合の積の部分において理解ができず行き詰まっています。

    Zi^3
    Zi^2Zj
    ZiZjZk

    となる箇所について証明して頂けないでしょうか?

    返信
  2. starpentagon 投稿作成者

    コメントありがとうございます。問2, 3の「和の積」を「積の和」に変換しているのは多項定理を使っています。多項定理についてはWikipedia(https://ja.wikipedia.org/wiki/%E5%A4%9A%E9%A0%85%E5%AE%9A%E7%90%86)に説明があります。問2では多項定理のn=3の場合、問3ではn=4の場合の多項定理を使って展開しています。

    返信

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です