コメント
標本平均の平均〜尖度に関する問題が出題されました。標本平均の平均、分散は頻出問題ですが歪度、尖度を求めるのは初めてという人も多かったと思います。
特に問3は[math]E\left[\left(\sum_{i=1}^nX_i-\mu\right)^4\right][/math]を求める際に[math]E[(X_i-\mu)^4][/math]以外の項も残ることに気付きづらい難問です。他の大問と比べ量、質ともに飛び抜けて難しく「選択しないのが正解」だったのではと思うほど難しい問題セットだと思います。
問題
- 期待値: [math]\mu=E[X][/math]
- 分散: [math]\sigma^2=V[X][/math]
- 歪度: [math]\beta_1=\dfrac{E[(X-\mu)^3]}{\sigma^3}[/math]
- 尖度: [math]\beta_2=\dfrac{E[(X-\mu)^4]}{\sigma^4}-3[/math]
とする。ただし、それぞれ有限で[math]\sigma^2 > 0[/math]とする。
確率変数[math]X_1,\dots,X_n[/math]は分布[math]D[/math]に従い互いに独立であるとする。
[math]
\begin{eqnarray}
\bar{X} &=& \dfrac{1}{n}\sum_{i=1}^n X_i \\
T^2 &=& \dfrac{1}{n}\sum_{i=1}^n (X_i-\mu)^2 \\
S^2 &=& \dfrac{1}{n-1}\sum_{i=1}^n (X_i-\bar{X})^2
\end{eqnarray}
[/math]
とするとき以下の問に答えよ。
(出典:統計検定HP「統計検定 1級の過去問題」。問題文を一部略記。)
問1
標本平均[math]\bar{X}[/math]の平均は
[math]
\begin{eqnarray}
E[\bar{X}] &=& E\left[\dfrac{1}{n}\sum_{i=1}^n X_i\right] \\
&=& \dfrac{1}{n}\sum_{i=1}^n E[X_i] \\
&=& \mu
\end{eqnarray}
[/math]
である。
[math]\bar{X}-\mu=\frac{1}{n}\sum_{i=1}^n(X_i – \mu)[/math]より分散は
[math]
\begin{eqnarray}
&& V[\bar{X}] \\
&=& E[(\bar{X} – \mu)^2] \\
&=& \dfrac{1}{n^2}E\left[\left\{\sum_{i=1}^n(X_i-\mu)\right\}^2\right]
\end{eqnarray}
[/math]
であり[math]X_i[/math]は互いに独立なので「積の期待値」は「期待値の積」になることに注意し
[math]
\begin{eqnarray}
&& E\left[\left\{\sum_{i=1}^n(X_i-\mu)\right\}^2\right] \\
&=& E\left[\sum_{i=1}^n(X_i-\mu)^2\right. \\
&&\quad \left.+\sum_{i\ne j}(X_i-\mu)(X_j – \mu)\right] \\
&=& \sum_{i=1}^nE\left[(X_i-\mu)^2\right] \\
&&\quad + \sum_{i\ne j}E\left[X_i-\mu\right]E\left[X_j – \mu\right] \\
&=& \sum_{i=1}^nV[X_i] \\
&=& n\sigma^2
\end{eqnarray}
[/math]
となる。これより[math]V[\bar{X}]=\frac{\sigma^2}{n}[/math]である。
[math]T^2[/math]の期待値を求めると
[math]
\begin{eqnarray}
E[T^2] &=& \dfrac{1}{n}\sum_{i=1}^n E[(X_i-\mu)^2] \\
&=& \dfrac{1}{n}\cdot n\sigma^2 \\
&=& \sigma^2
\end{eqnarray}
[/math]
より[math]T^2[/math]は[math]\sigma^2[/math]の不偏推定量である。
次に[math]S^2[/math]の期待値を求めると[math](X_i – \bar{X})^2[/math]を平均[math]\mu[/math]周りで展開して
[math]
\begin{eqnarray}
&& (X_i – \bar{X})^2 \\
&=& (X_i – \mu)^2 \\
&&\quad – 2(X_i – \mu)(\bar{X}-\mu) + (\bar{X} – \mu)^2 \\
&=& (X_i – \mu)^2 \\
&& \quad – \dfrac{2}{n}\sum_{j=1}^n(X_i – \mu)(X_j-\mu) + (\bar{X} – \mu)^2
\end{eqnarray}
[/math]
より
[math]
\begin{eqnarray}
&& E\left[(X_i – \bar{X})^2\right] \\
&=& \sigma^2 – \dfrac{2\sigma^2}{n} + \dfrac{\sigma^2}{n}
&=& \dfrac{n-1}{n}\sigma^2
\end{eqnarray}
[/math]
なので
[math]
\begin{eqnarray}
E[S^2] &=& \dfrac{1}{n-1}\sum_{i=1}^n E\left[(X_i-\bar{X})^2\right] \\
&=& \dfrac{1}{n-1}\cdot n \cdot \dfrac{n-1}{n}\sigma^2 \\
&=& \sigma^2
\end{eqnarray}
[/math]
より[math]S^2[/math]は[math]\sigma^2[/math]の不偏推定量である。
問2
また「和の三乗」の期待値は一度[math]n=2[/math]の時のケースを考えると
[math]
\begin{eqnarray}
&& (Z_1 + Z_2)^3 \\
&=& Z_1^3 + 3Z_1^2 Z_2 + 3Z_1 Z_2^2 + Z_2^3
\end{eqnarray}
[/math]
と展開でき、独立性と[math]E[Z_i]=0[/math]より[math]E[Z_i^3][/math]のみが残り[math]\beta_1[/math]と結びつけることができます。これを一般の[math]n[/math]場合に拡張し[math]\bar{X}[/math]の歪度を出すことができます。
定数[math]a > 0, b[/math]を用いて[math]Y=aX+b[/math]とすると[math]E[Y]=a\mu+b[/math], [math]V[Y]=a^2\sigma^2[/math]より
[math]
\begin{eqnarray}
\beta_1(Y) &=& \dfrac{E\left[(Y-E[Y])^3\right]}{\sqrt{V[Y]}^3} \\
&=& \dfrac{a^3E\left[(X-\mu)^3\right]}{a^3\sigma^3} \\
&=& \beta_1(X)
\end{eqnarray}
[/math]
なので線形変換に対して不変である。したがって、[math]Z_i=\frac{X_i-\mu}{\sigma}[/math]と変換し、平均[math]0[/math]、分散[math]1[/math]の場合を考えれば十分である。この時、[math]\beta_1=E[Z_i^3][/math]になる。
標本平均[math]\bar{Z}=\frac{1}{n}\sum_{i=1}^n Z_i[/math]は平均[math]0[/math]、分散[math]\frac{1}{n}[/math]なので
[math]
\begin{eqnarray}
\beta_1(\bar{Z}) &=& \dfrac{E\left[\left(\frac{1}{n}\sum_{i=1}^n Z_i\right)^3\right]}{\sqrt{1/n}^3} \\
&=& \dfrac{E\left[\left(\sum_{i=1}^n Z_i\right)^3\right]}{n\sqrt{n}}
\end{eqnarray}
[/math]
である。ここで[math]\left(\sum_{i=1}^n Z_i\right)^3[/math]を展開すると[math]i, j, k[/math]を互いに異なる添字として
- [math]Z_i^3[/math]
- [math]Z_i^2Z_j[/math]
- [math]Z_iZ_jZ_k[/math]
の形の項が現れ[math]E[Z_i^2Z_j]=E[Z_i^2]E[Z_j]=0[/math]および[math]E[Z_iZ_jZ_k]=0[/math]なので[math]E[Z_i^3][/math]のみ残ることに注意すると
[math]
\begin{eqnarray}
E\left[\left(\sum_{i=1}^n Z_i\right)^3\right] &=& \sum_{i=1}^{n}E[Z_i^3] \\
&=& n\beta_1
\end{eqnarray}
[/math]
より
[math]
\begin{eqnarray}
\beta_1(\bar{X}) &=& \beta_1(\bar{Z}) \\
&=& \dfrac{\beta_1}{\sqrt{n}}
\end{eqnarray}
[/math]
である。
問3
また「和の四乗」の期待値は一度[math]n=2[/math]の時のケースを考えると
[math]
\begin{eqnarray}
&& (Z_1 + Z_2)^4 \\
&=& Z_1^4 + 4Z_1^3 Z_2 + 6Z_1^2Z_2^2 + 4Z_1 Z_2^3 + Z_2^4
\end{eqnarray}
[/math]
と展開できますが、期待値を取った時に[math]E[Z_i^4][/math]だけではなく[math]E[Z_1^2Z_2^2][/math]も残ることに注意しましょう。
定数[math]a > 0, b[/math]を用いて[math]Y=aX+b[/math]とすると[math]E[Y]=a\mu+b[/math], [math]V[Y]=a^2\sigma^2[/math]より
[math]
\begin{eqnarray}
\beta_2(Y) &=& \dfrac{E\left[(Y-E[Y])^4\right]}{\sqrt{V[Y]}^4}-3 \\
&=& \dfrac{a^4E\left[(X-\mu)^4\right]}{a^4\sigma^4}-3 \\
&=& \beta_2(X)
\end{eqnarray}
[/math]
なので線形変換に対して不変である。したがって、[math]Z_i=\frac{X_i-\mu}{\sigma}[/math]と変換し、平均[math]0[/math]、分散[math]1[/math]の場合を考えれば十分である。この時、[math]\beta_2=E[Z_i^4]-3[/math]になる。
標本平均[math]\bar{Z}=\frac{1}{n}\sum_{i=1}^n Z_i[/math]は平均[math]0[/math]、分散[math]\frac{1}{n}[/math]なので
[math]
\begin{eqnarray}
\beta_2(\bar{Z}) &=& \dfrac{E\left[\left(\frac{1}{n}\sum_{i=1}^n Z_i\right)^4\right]}{\sqrt{1/n}^4} – 3 \\
&=& \dfrac{E\left[\left(\sum_{i=1}^n Z_i\right)^4\right]}{n^2} – 3
\end{eqnarray}
[/math]
である。ここで[math]\left(\sum_{i=1}^n Z_i\right)^4[/math]を展開すると[math]i, j, k, l[/math]を互いに異なる添字として
- [math]Z_i^4[/math]
- [math]Z_i^3Z_j[/math]
- [math]Z_i^2Z_j^2[/math]
- [math]Z_i^2Z_jZ_k[/math]
- [math]Z_iZ_jZ_kZ_l[/math]
の形の項が現れ[math]E[Z_i^3Z_j][/math], [math]E[Z_i^2Z_jZ_k][/math],[math]E[Z_iZ_jZ_kZ_l][/math]は[math]0[/math]なので[math]E[Z_i^4],\ E[Z_i^2Z_j^2][/math]のみ残ることに注意すると
[math]
\begin{eqnarray}
&& E\left[\left(\sum_{i=1}^n Z_i\right)^4\right] \\
&=& \sum_{i=1}^{n}E[Z_i^4]+\sum_{i\ne j}{}_4C_2E[Z_i^2]E[Z_j^2] \\
&=& n(\beta_2+3) + {}_nC_2\cdot{}_4C_2\cdot 1 \cdot 1 \\
&=& n(\beta_2+3) + 3n(n-1) \\
&=& n(\beta_2 + 3n)
\end{eqnarray}
[/math]
より
[math]
\begin{eqnarray}
\beta_2(\bar{X}) &=& \beta_2(\bar{Z}) \\
&=& \dfrac{n(\beta_2 + 3n)}{n^2} – 3 \\
&=& \dfrac{\beta_2}{n}
\end{eqnarray}
[/math]
である。
問4
[math]n\to\infty[/math]の時[math]\beta_1(\bar{X})\to 0[/math], [math]\beta_2(\bar{X})\to 0[/math]より歪度、尖度はともに[math]0[/math]に近づく。
問5
- [math]\mu[/math]が既知のとき、[math]\sigma^2[/math]の最尤推定量は[math]T^2[/math]になることを示せ。
- [math]\mu[/math]が未知のとき、[math]\sigma^2[/math]の最尤推定量を[math]S^2[/math]を用いて表せ。
なお、[math]X[/math]の確率密度関数が[math]f(x)=\frac{1}{\sqrt{2\pi\sigma^2}}\exp\left[-\frac{(x-\mu)^2}{2\sigma^2}\right][/math]であることは既知としてよい。
[math]\mu[/math]が既知([math]\mu=\mu_0[/math])の場合
[math]X_1,\dots,X_n[/math]の観測値を[math]x_1,\dots,x_n[/math]とする。標準偏差[math]\sigma[/math]をパラメータとし、[math]C=\frac{1}{\sqrt{2\pi}}[/math]とおくと尤度関数[math]L(\sigma|\mathbf{x})[/math]は
[math]
\begin{eqnarray}
&& L(\mu | \mathbf{x})\\
&=& \prod_{i=1}^{n} f(x_i|\sigma) \\
&=& \dfrac{C^n}{\sigma^n} \exp\left[-\frac{1}{2\sigma^2}\sum_{i=1}^n (x_i-\mu_0)^2 \right]
\end{eqnarray}
[/math]
となるので対数尤度は
[math]
\begin{eqnarray}
&& \log L(\sigma\ |\ \mathbf{x}) \\
&=& n(\log C – \log \sigma)-\frac{1}{2\sigma^2}\sum_{i=1}^n (x_i-\mu_0)^2
\end{eqnarray}
[/math]
となる。ここで
[math]
\dfrac{\partial (\log L)}{\partial \sigma} = 0
[/math]
を解くと
[math]
\sigma^{2} = \dfrac{1}{n}\sum_{i=1}^n (x_i – \mu_0)^2
[/math]
を得る。よって、[math]T^2=\frac{1}{n}\sum_{i=1}^n (X_i – \mu_0)^2[/math]は[math]\sigma^2[/math]の最尤推定量である。
[math]\mu[/math]が未知の場合
[math]X_1,\dots,X_n[/math]の観測値を[math]x_1,\dots,x_n[/math]とする。平均[math]\mu[/math]と標準偏差[math]\sigma[/math]をパラメータとする。[math]C=\frac{1}{\sqrt{2\pi}}[/math]とおくと尤度関数[math]L(\mu,\sigma|\mathbf{x})[/math]は
[math]
\begin{eqnarray}
&& L(\mu,\sigma|\mathbf{x})\\
&=& \prod_{i=1}^{n} f(x_i|\mu,\sigma) \\
&=& \dfrac{C^n}{\sigma^n} \exp\left[-\frac{1}{2\sigma^2}\sum_{i=1}^n (x_i-\mu)^2 \right]
\end{eqnarray}
[/math]
となるので対数尤度は
[math]
\begin{eqnarray}
&& \log L(\mu,\sigma\ |\ \mathbf{x}) \\
&=& n(\log C – \log \sigma)-\frac{1}{2\sigma^2}\sum_{i=1}^n (x_i-\mu)^2
\end{eqnarray}
[/math]
となる。ここで、
[math]
\begin{cases}
\dfrac{\partial (\log L)}{\partial \mu} = 0 \\
\dfrac{\partial (\log L)}{\partial \sigma} = 0
\end{cases}
[/math]
を解くと
[math]
\begin{cases}
\mu = \dfrac{1}{n}\sum_{i=1}^n x_i \\
\sigma^{2} = \dfrac{1}{n}\sum_{i=1}^n (x_i – \mu)^2
\end{cases}
[/math]
を得る。これより[math]\sigma^2[/math]の最尤推定量は
[math]
\begin{eqnarray}
&& \dfrac{1}{n}\sum_{i=1}^n (X_i – \bar{X})^2 \\
&=& \dfrac{n-1}{n}S^2
\end{eqnarray}
[/math]
である。
シリーズ記事
- 過去問と解答例
- 2017年(統計数理)大問1
- 2017年(統計数理)大問1 解答例(本記事)
- 2017年(統計数理)大問2
- 2017年(統計数理)大問2 解答例
- 2017年(統計数理)大問4
- 2017年(統計数理)大問4 解答例
大変詳しい解説ありがとうございます。私の知識不足で恐縮ですが、問2、問3で出てくる和集合の積の部分において理解ができず行き詰まっています。
Zi^3
Zi^2Zj
ZiZjZk
となる箇所について証明して頂けないでしょうか?
コメントありがとうございます。問2, 3の「和の積」を「積の和」に変換しているのは多項定理を使っています。多項定理についてはWikipedia(https://ja.wikipedia.org/wiki/%E5%A4%9A%E9%A0%85%E5%AE%9A%E7%90%86)に説明があります。問2では多項定理のn=3の場合、問3ではn=4の場合の多項定理を使って展開しています。