【統計検定1級過去問】2018年(統計数理)大問2 解答例

投稿者: | 2019-05-04

コメント

大学入試でもテーマになる「非復元抽出」が題材です。問1は素直に

場合の数を数え上げる

ことで求められます。大学受験から時間の経っていない人には簡単だったと思いますが、「各試行は独立でないから[math]i-1[/math]回目までのパターンを列挙して…」などと考えるとどツボにはまってしまいます。

問4までは誘導に乗ってスムーズに解けます。問5は[math]V[\hat{N}][/math]の評価が難しいですが、問1〜4と問5の推定量を作るところまでで部分点を十分に稼げる問題セットだと思います。

問題

箱の中に[math]N(\geq 2)[/math]個の球があり赤玉が[math]M[/math]個、青玉が[math]N-M[/math]個入っている。この箱から非復元抽出で[math]n[/math]個の球を取り出す。第[math]i[/math]回目の抽出結果を表す確率変数を[math]X_i[/math]とし赤玉の場合は[math]1[/math], 青玉の場合は[math]0[/math]とする。この時、以下の問いに答えよ。

(出典:統計検定HP「統計検定 1級の過去問題」。問題文を一部略記。)

問1

[math]P(X_i = 1)[/math]および[math]P(X_i=1,\ X_j=1)\ (i\ne j)[/math]を求めよ。

[math]N[/math]個の球に[math]1,\dots,N[/math]の番号を振る。[math]N[/math]個から[math]n[/math]個を選ぶ場合の数は[math]{}_NP_n[/math]である。まず[math]P(X_i = 1)[/math]を求める。

[math]i[/math]番目が赤玉になる場合の数は

  • [math]i[/math]番目が赤玉: [math]M[/math]通り
  • [math]i[/math]番目以外は任意: [math]N-1[/math]個から[math]n-1[/math]個を選ぶ場合の数なので[math]{}_{N-1}P_{n-1}[/math]通り

なので

[math]
\begin{eqnarray}

P(X_i = 1) &=& \dfrac{M\cdot {}_{N-1}P_{n-1}}{{}_NP_n} \\
&=& M \cdot \dfrac{(N-1)!}{(N-n)!}\cdot\dfrac{(N-n)!}{N!} \\
&=& \dfrac{M}{N}
\end{eqnarray}
[/math]

である。

次に[math]P(X_i=1,\ X_j=1)\ (i\ne j)[/math]を求める。[math]i,\ j[/math]番目が赤玉になる場合の数は

  • [math]i,\ j[/math]番目が赤玉: [math]M(M-1)[/math]通り
  • [math]i,\ j[/math]番目以外は任意: [math]N-2[/math]個から[math]n-2[/math]個を選ぶ場合の数なので[math]{}_{N-2}P_{n-2}[/math]通り

なので

[math]
\begin{eqnarray}
&&
P(X_i = 1,\ X_j=1) \\
&=& \dfrac{M(M-1)\cdot {}_{N-2}P_{n-2}}{{}_NP_n} \\
&=& M(M-1) \cdot \dfrac{(N-2)!}{(N-n)!}\cdot\dfrac{(N-n)!}{N!} \\
&=& \dfrac{M(M-1)}{N(N-1)}
\end{eqnarray}
[/math]

である。

問2

[math]E[X_i],\ V[X_i],\ Cov(X_i, X_j)\ (i\ne j)[/math]を求めよ。

[math]

E[X_i] = \sum_{k=0}^1 kP(X_i = k) = P(X_i = 1) = \dfrac{M}{N}
[/math]

である。同様に[math]E[X_i^2]=\dfrac{M}{N}[/math]なので

[math]
\begin{eqnarray}
V[X_i] &=& E[X_i^2] – E[X_i]^2 \\
&=& = \dfrac{M}{N} – \dfrac{M^2}{N^2} \\
&=& \dfrac{M(N-M)}{N^2}
\end{eqnarray}
[/math]

である。最後に共分散[math]Cov(X_i, X_j)[/math]を求めると

[math]
\begin{eqnarray}
&&
Cov(X_i, X_j) \\
&=& E[X_iX_j] – E[X_i]E[X_j] \\
&=& \sum_{k, l} klP(X_i=k,\ X_j=l) – E[X_i]E[X_j] \\
&=& P(X_i=1,\ X_j=1) – E[X_i]E[X_j] \\
&=& \dfrac{M(M-1)}{N(N-1)} – \dfrac{M^2}{N^2} \\
&=& \dfrac{M(M-N)}{N^2(N-1)}
\end{eqnarray}
[/math]

である。

問3

[math]X=\sum_{i=1}^n X_i[/math]とする時、[math]P(X=x)[/math]を求めよ。
  • 赤玉を[math]x[/math]個を選ぶ組合せは[math]{}_MC_{x}[/math]通り
  • 青玉を[math]n-x[/math]個を選ぶ組合せは[math]{}_{N-M}C_{n-x}[/math]通り

なので

[math]
\begin{eqnarray}

P(X=x) &=& \dfrac{{}_MC_{x}\cdot {}_{N-M}C_{n-x} \cdot n!}{{}_NP_n} \\
&=& \dfrac{{}_MC_{x}\cdot {}_{N-M}C_{n-x}}{{}_NC_n}
\end{eqnarray}
[/math]

である。

問4

[math]E[X],\ V[X][/math]を求めよ。

まず[math]E[X][/math]を求めると

[math]

E[X] = \sum_{i=1}^n E[X_i] = \dfrac{nM}{N}
[/math]

である。

次に[math]V[X][/math]を求めると

[math]
\begin{eqnarray}
&&
V[X] \\
&=& \sum_{i=1}^n V[X_i] + \sum_{i\ne j}Cov(X_i,\ X_j) \\
&=& \dfrac{nM(N-M)}{N^2} + n(n-1)\cdot \dfrac{M(M-N)}{N^2(N-1)} \\
&=& \dfrac{nM(N-M)}{N^2}\left\{ 1 – \dfrac{n-1}{N-1}\right\} \\
&=& \dfrac{nM(N-M)(N-n)}{N^2(N-1)}
\end{eqnarray}
[/math]

である。

問5

箱の中に青玉のみ[math]N[/math]個(ただし[math]N[/math]は未知)入っている。[math]N[/math]を推定するために箱の中に赤玉を[math]K[/math]個入れ、よくかき混ぜたのち非復元抽出で[math]n[/math]個取り出し、その中の赤玉の個数を[math]X[/math]とする。[math]K,\ X,\ n[/math]を用いて[math]N[/math]の推定量[math]\hat{N}[/math]を作れ。さらに[math]N,\ X[/math]が十分大きいとして[math]\epsilon = \frac{\sqrt{V[\hat{N}]}}{N}[/math]を求めよ。
[math]\hat{N}[/math]を求めるところまではできると思いますが、[math]V[\hat{N}][/math]を評価する際に[math]V[1/X][/math]を求める必要がありデルタ法に気付けるかがポイントです。

赤玉を混ぜた後は箱の中には赤玉が[math]K[/math]個、青玉が[math]N[/math]個、全体で[math](N+K)[/math]個の球があるので

[math]

E[X] = \dfrac{nK}{N+K}
[/math]

が成立する。[math]N[/math]について整理して

[math]

N = \dfrac{K(n-E[X])}{E[X]}
[/math]

より推定量[math]\hat{N}[/math]として

[math]

\hat{N} = \dfrac{K(n-X)}{X}
[/math]

が考えられる。この時、

[math]

V[\hat{N}] = K^2n^2V\left[\frac{1}{X}\right]
[/math]

であり[math]f(x)=1/x[/math]とするとデルタ法より

[math]
\begin{eqnarray}
&& V
\left[\frac{1}{X}\right] \\
&=& V[f(X)] \\
&=& f'(E[X])^2V[X] \\
&=& \dfrac{1}{E[X]^4}V[X] \\
&=& \frac{(N+K)^{4}}{n^{4} K^{4}} \cdot \frac{nKN(N+K-n)}{(N+K)^2(N+K-1)}
\end{eqnarray}
[/math]

である。[math]N \gg 1[/math]より[math]N+K-1 \approx N+K[/math]なので

[math]

V
\left[\frac{1}{X}\right] = \dfrac{N(N+K)(N+K-n)}{n^3K^3}
[/math]

と書け

[math]

V[\hat{N}] = \dfrac{N(N+K)(N+K-n)}{nK}
[/math]

を得る。これより

[math]
\begin{eqnarray}

\epsilon &=& \frac{\sqrt{V[\hat{N}]}}{N} \\
&=& \sqrt{\dfrac{(N+K)(N+K-n)}{nNK}}
\end{eqnarray}
[/math]

である。

シリーズ記事

スポンサーリンク


【統計検定1級過去問】2018年(統計数理)大問2 解答例」への1件のフィードバック

  1. 統計学学習者

    はじめまして。

    [5]でE[X]をXの推定量としているのは、N→∞の時にV[X]→0時になるので、チェビシェフの不等式から一致推定量として導かれるということでしょうか。

    あと、最後のεの求め方は、よくわかりました。
    ですが、標準偏差をNで割ったような値を求めることが、統計学的に何を意味するのかご存知ですか?
    公式の過去問集をみても、この値の目的がわかりませんでした。

    調べてみてもわからなかったので、質問してみました。

    もしよろしければ、お時間のあるときにご回答いただければ幸いです。

    よろしくお願いいたします。

    返信

コメントを残す

メールアドレスが公開されることはありません。