コメント
大学入試でもテーマになる「非復元抽出」が題材です。問1は素直に
場合の数を数え上げる
ことで求められます。大学受験から時間の経っていない人には簡単だったと思いますが、「各試行は独立でないから[math]i-1[/math]回目までのパターンを列挙して…」などと考えるとどツボにはまってしまいます。
問4までは誘導に乗ってスムーズに解けます。問5は[math]V[\hat{N}][/math]の評価が難しいですが、問1〜4と問5の推定量を作るところまでで部分点を十分に稼げる問題セットだと思います。
問題
(出典:統計検定HP「統計検定 1級の過去問題」。問題文を一部略記。)
問1
[math]N[/math]個の球に[math]1,\dots,N[/math]の番号を振る。[math]N[/math]個から[math]n[/math]個を選ぶ場合の数は[math]{}_NP_n[/math]である。まず[math]P(X_i = 1)[/math]を求める。
[math]i[/math]番目が赤玉になる場合の数は
- [math]i[/math]番目が赤玉: [math]M[/math]通り
- [math]i[/math]番目以外は任意: [math]N-1[/math]個から[math]n-1[/math]個を選ぶ場合の数なので[math]{}_{N-1}P_{n-1}[/math]通り
なので
[math]
\begin{eqnarray}
P(X_i = 1) &=& \dfrac{M\cdot {}_{N-1}P_{n-1}}{{}_NP_n} \\
&=& M \cdot \dfrac{(N-1)!}{(N-n)!}\cdot\dfrac{(N-n)!}{N!} \\
&=& \dfrac{M}{N}
\end{eqnarray}
[/math]
である。
次に[math]P(X_i=1,\ X_j=1)\ (i\ne j)[/math]を求める。[math]i,\ j[/math]番目が赤玉になる場合の数は
- [math]i,\ j[/math]番目が赤玉: [math]M(M-1)[/math]通り
- [math]i,\ j[/math]番目以外は任意: [math]N-2[/math]個から[math]n-2[/math]個を選ぶ場合の数なので[math]{}_{N-2}P_{n-2}[/math]通り
なので
[math]
\begin{eqnarray}
&&
P(X_i = 1,\ X_j=1) \\
&=& \dfrac{M(M-1)\cdot {}_{N-2}P_{n-2}}{{}_NP_n} \\
&=& M(M-1) \cdot \dfrac{(N-2)!}{(N-n)!}\cdot\dfrac{(N-n)!}{N!} \\
&=& \dfrac{M(M-1)}{N(N-1)}
\end{eqnarray}
[/math]
である。
問2
[math]
E[X_i] = \sum_{k=0}^1 kP(X_i = k) = P(X_i = 1) = \dfrac{M}{N}
[/math]
である。同様に[math]E[X_i^2]=\dfrac{M}{N}[/math]なので
[math]
\begin{eqnarray}
V[X_i] &=& E[X_i^2] – E[X_i]^2 \\
&=& = \dfrac{M}{N} – \dfrac{M^2}{N^2} \\
&=& \dfrac{M(N-M)}{N^2}
\end{eqnarray}
[/math]
である。最後に共分散[math]Cov(X_i, X_j)[/math]を求めると
[math]
\begin{eqnarray}
&&
Cov(X_i, X_j) \\
&=& E[X_iX_j] – E[X_i]E[X_j] \\
&=& \sum_{k, l} klP(X_i=k,\ X_j=l) – E[X_i]E[X_j] \\
&=& P(X_i=1,\ X_j=1) – E[X_i]E[X_j] \\
&=& \dfrac{M(M-1)}{N(N-1)} – \dfrac{M^2}{N^2} \\
&=& \dfrac{M(M-N)}{N^2(N-1)}
\end{eqnarray}
[/math]
である。
問3
- 赤玉を[math]x[/math]個を選ぶ組合せは[math]{}_MC_{x}[/math]通り
- 青玉を[math]n-x[/math]個を選ぶ組合せは[math]{}_{N-M}C_{n-x}[/math]通り
なので
[math]
\begin{eqnarray}
P(X=x) &=& \dfrac{{}_MC_{x}\cdot {}_{N-M}C_{n-x} \cdot n!}{{}_NP_n} \\
&=& \dfrac{{}_MC_{x}\cdot {}_{N-M}C_{n-x}}{{}_NC_n}
\end{eqnarray}
[/math]
である。
問4
まず[math]E[X][/math]を求めると
[math]
E[X] = \sum_{i=1}^n E[X_i] = \dfrac{nM}{N}
[/math]
である。
次に[math]V[X][/math]を求めると
[math]
\begin{eqnarray}
&&
V[X] \\
&=& \sum_{i=1}^n V[X_i] + \sum_{i\ne j}Cov(X_i,\ X_j) \\
&=& \dfrac{nM(N-M)}{N^2} + n(n-1)\cdot \dfrac{M(M-N)}{N^2(N-1)} \\
&=& \dfrac{nM(N-M)}{N^2}\left\{ 1 – \dfrac{n-1}{N-1}\right\} \\
&=& \dfrac{nM(N-M)(N-n)}{N^2(N-1)}
\end{eqnarray}
[/math]
である。
問5
赤玉を混ぜた後は箱の中には赤玉が[math]K[/math]個、青玉が[math]N[/math]個、全体で[math](N+K)[/math]個の球があるので
[math]
E[X] = \dfrac{nK}{N+K}
[/math]
が成立する。[math]N[/math]について整理して
[math]
N = \dfrac{K(n-E[X])}{E[X]}
[/math]
より推定量[math]\hat{N}[/math]として
[math]
\hat{N} = \dfrac{K(n-X)}{X}
[/math]
が考えられる。この時、
[math]
V[\hat{N}] = K^2n^2V\left[\frac{1}{X}\right]
[/math]
であり[math]f(x)=1/x[/math]とするとデルタ法より
[math]
\begin{eqnarray}
&& V
\left[\frac{1}{X}\right] \\
&=& V[f(X)] \\
&=& f'(E[X])^2V[X] \\
&=& \dfrac{1}{E[X]^4}V[X] \\
&=& \frac{(N+K)^{4}}{n^{4} K^{4}} \cdot \frac{nKN(N+K-n)}{(N+K)^2(N+K-1)}
\end{eqnarray}
[/math]
である。[math]N \gg 1[/math]より[math]N+K-1 \approx N+K[/math]なので
[math]
V
\left[\frac{1}{X}\right] = \dfrac{N(N+K)(N+K-n)}{n^3K^3}
[/math]
と書け
[math]
V[\hat{N}] = \dfrac{N(N+K)(N+K-n)}{nK}
[/math]
を得る。これより
[math]
\begin{eqnarray}
\epsilon &=& \frac{\sqrt{V[\hat{N}]}}{N} \\
&=& \sqrt{\dfrac{(N+K)(N+K-n)}{nNK}}
\end{eqnarray}
[/math]
である。
シリーズ記事
- 過去問と解答例
- 2018年(統計数理)大問2
- 2018年(統計数理)大問2 解答例(本記事)
- 2018年(統計数理)大問3
- 2018年(統計数理)大問3 解答例
- 2018年(統計数理)大問5
- 2018年(統計数理)大問5 解答例
はじめまして。
[5]でE[X]をXの推定量としているのは、N→∞の時にV[X]→0時になるので、チェビシェフの不等式から一致推定量として導かれるということでしょうか。
あと、最後のεの求め方は、よくわかりました。
ですが、標準偏差をNで割ったような値を求めることが、統計学的に何を意味するのかご存知ですか?
公式の過去問集をみても、この値の目的がわかりませんでした。
調べてみてもわからなかったので、質問してみました。
もしよろしければ、お時間のあるときにご回答いただければ幸いです。
よろしくお願いいたします。