統計検定2級の勉強会で統計検定のHPに掲載されている過去問を解いた際の解答メモを公開します。方針として
- 単純な問題は特に記載せず
- 基本問題は参照すべきトピックを記載
- 応用問題は解答のポイントを記載
としており、正解までの道のりが長い一部の問題は途中式も記載しています。
なお、他の開催分の解答例はこちらを参照ください。
問1
[1]記述1〜3の正誤は
- TVの最小値がPCの最大値より高いので「正」
- PCの第3四分位(上位25%の点。つまり上位11都道府県での最小値)がDVD/BDの最大値より高いので「正」
- MPの最大値がSPの最小値を超えており必ずしも正しいとは限らず「誤」
[2]MP, SPのヒストグラムとして適切なものを探すと箱ひげ図から
- MP: 最大値が75〜80, 最小値が55〜60なので「b」
- SP: 最大値が80〜85, 最小値が55〜60なので「a」
問2
[3], [4]累積度数を求め中央値、第1四分位、第3四分位を含む階級を求める。
[5]度数分布表から
- 北海道: 階級(J)-(M)が他の都道府県と比べ圧倒的に大きく「エ」
- 秋田: 差が読み取りやすい階級(A)-(D)の構成割合を求めると[math]45\%[/math]なので「ウ」
問3
[7]記述1〜3の正誤は
- 季節による影響を軽減するため前年同月と比較するのが適切で「誤」
- 左のグラフより「正」
- 仮に2015年12月の北アメリカ計がアジア計から1,000千人少ない500千人程度としても前年同期比伸び率は[math]400\%[/math]とアジア計の伸び率を上回るため「誤」
[8]訪日外客数(アジア計)は増加傾向にあるので自己相関係数が正の高い値から徐々に減少する「1」が適切。
問4
[11]最小二乗法で求めた傾き[math]b[/math]に対して標準誤差[math]s_e[/math]とすると[math]t=\frac{b}{s_e}[/math]は自由度[math]N-2=23[/math]の[math]t[/math]分布に従うので「5」が適切。
問5
[12]記述1〜5は
- 多段抽出はグループを絞っていく過程でグループ自体に特性が生じ一般に多段になるほど代表性が低くなるので「誤」
- 層別抽出で比例割当を行う場合は正しいが最適割当を行う場合は必ずしも正しくなく「誤」
- 街頭インタビューでは家にいる人は対象にならないなど街全体の単純無作為抽出にはならず「誤」
- 正しい
- 回答率が上がっても偏りが生じる等で精度が向上しないこともあり「誤」
問6
[13][math]B[/math]の重さ[math]W_B=\frac{X-Y}{2}[/math]と[math]V[aX\pm bY]=a^2V[X]+b^2V[Y][/math]を利用して計算。
問7
規格外を[math]F[/math]で表す。
[14]
[math]
\begin{eqnarray}
P(F\cap X)&=&P(X)P(F|X) \\
&=&0.40 \times 0.10 \\
&=&0.04
\end{eqnarray}
[/math]
である。
[15]
[math]
\begin{eqnarray}
&&P(F) \\
&=&P(X)P(F|X)+P(Y)P(F|Y)\\
&&\quad +P(Z)P(F|Z)\\
&=&0.04+0.015+0.006 \\
&=&0.061
\end{eqnarray}
[/math]
である。
[16]
[math]
\begin{eqnarray}
P(X|F)&=&\dfrac{P(X)P(F|X)}{P(F)}\\
&=&\dfrac{0.04}{0.061}=0.656
\end{eqnarray}
[/math]
である。
問8
[17]第4局まで名人の3勝1敗で5局目に名人が勝つ確率なので[math]{}_4C_3 (0.7)^3(0.3)\times 0.7=0.288[/math]である。
[18]第7局まで行われるのは第6局まで名人の3勝3敗になる場合なので[math]{}_6C_3 (0.7)^3(0.3)^3=0.185[/math]である。
問9
[19]まず共分散[math]Cov(U,V)[/math]を求めると[math]E[U]=E[V]=0[/math]なので
[math]
\begin{eqnarray}
&&Cov(U,V)\\
&=&E[(U-E[U])(V-E[V])] \\
&=& E[UV] \\
&=& E[(X+Y)(X-Y)] \\
&=& E[X^2-Y^2] \\
&=& (V[X]-E[X]^2) – (V[Y]-E[Y]^2) \\
&=& \sigma_1^2-\sigma_2^2
\end{eqnarray}
[/math]
である。[math]U,V[/math]の分散はともに[math]V[X\pm Y]=\sigma_1^2+\sigma_2^2[/math]なので相関係数[math]r[/math]は
[math]
\begin{eqnarray}
r &=& \dfrac{Cov(U,V)}{\sqrt{V[U]V[V]}} \\
&=& \dfrac{\sigma_1^2-\sigma_2^2}{\sigma_1^2+\sigma_2^2}
\end{eqnarray}
[/math]
である。
[20]記述1〜3の正誤は
- ともに平均は[math]0[/math]なので「正」
- [math](U, V)[/math]は二次元正規分布に従い[math]U, V[/math]が独立[math]\Leftrightarrow[/math]相関[math]r=0\Leftrightarrow \sigma_1=\sigma_2[/math]より「正」
- [math]U, V[/math]ともに平均[math]0[/math], 分散[math]\sigma_1^2+\sigma_2^2[/math]の正規分布に従うので「正」
問10
[21], [22][math]W_n \sim \chi^2(n)[/math]より数表から求められる。
問11
[23][math]n[/math]事業所を調査した時の標本平均を[math]\bar{X}_n[/math]とすると[math]\bar{X}_n\sim \mathcal{N}(\mu,\ \frac{\sigma^2}{n})[/math]である。この時、相対誤差[math]R_e(n)=\frac{\bar{X}_n-\mu}{\mu}\sim \mathcal{N}(0,\ \frac{\sigma^2}{n\mu^2})[/math]について
[math]
\begin{eqnarray}
&&P(-0.05 \leq R_e(n) \leq 0.05) \geq 0.95\\
&\Leftrightarrow& P(R_e(n) \geq 0.05) \leq 0.025
\end{eqnarray}
[/math]
となる最小の[math]n[/math]を求める。
変動係数[math]\frac{\sigma}{\mu}=0.4[/math]より[math]R_e(n)\sim \mathcal{N}(0, \frac{0.4^2}{n})[/math]なので[math]Z=\frac{\sqrt{n}R_e(n)}{0.4}[/math]は標準正規分布に従うことから
[math]
\begin{eqnarray}
&& P(R_e(n) \geq 0.05) \\
&=& P\left(Z \geq \frac{0.05}{0.4}\sqrt{n}\right)
\end{eqnarray}
[/math]
と変形し、標準正規分布の上側確率が[math]2.5\%[/math]になるのは[math]z=1.96[/math]の時なので
[math]
\frac{0.05}{0.4}\sqrt{n} \geq 1.96
[/math]
の時、[math]95\%[/math]以上の確率で相対誤差が[math]5\%[/math]以下になる。この不等式を満たす最小の[math]n[/math]を求めると[math]n=246[/math]である。
問12
[24]母集団の標本が十分大きく標準誤差は[math]\dfrac{\sigma}{\sqrt{n}}[/math]で与えられるため「4」が適切。
[25]標準正規分布の上側[math]5%[/math]点は[math]z=1.64[/math]なので[math]90\%[/math]信頼区間の上下限は
- 上限: [math]515+1.64\times 3.40=521[/math]分
- 下限: [math]515-1.64\times 3.40=509[/math]分
になる。
[26]記述1〜3の正誤は
- 標本平均は母平均の不偏推定量なので「正」
- [math]95\%[/math]信頼区間の幅は[math]90\%[/math]の時より広くなるので「誤」
- 調査数を[math]1/3[/math]にすると標準誤差は[math]\sqrt{3}[/math]倍になり幅も[math]\sqrt{3}[/math]倍になるので「誤」
[27]母分散の比の検定を参照。
問13
[28], [29][math]2 \times 2[/math]の分割表の独立性検定を参照。
問14
[30], [31], [32]一元配置分散分析を参照。
問15
[35]記述1〜5の正誤は
- 最盛期年齢についてのモデルで博士号取得の年齢については分からないので「誤」
- PhDAgeの係数が正なので若く博士号を取得した人ほど早く最盛期に達するので「誤」
- Theoriticalの係数が負のため理論研究を中心に行う研修者の方が早く最盛期に達するので「誤」
- Theoriticalは有意であるため「誤」
- 正しい
17]第4局まで名人の3勝1敗で5局目に名人が勝つ確率なので4C1(0.7)3(0.3)×0.7=0.288
4
C
1
(
0.7
)
3
(
0.3
)
×
0.7
=
0.288
である。
間違いがあります
4C3 です
竹内さま
コメントありがとうございます。修正しました。