2019年6月開催分の解答例です。
例年通りデータの読み取り、確率、確率分布、区間推定、仮説検定、回帰モデルからバランスよく出題されました。過去には難問が混ざることもありましたが今回はオーソドックスな問題が多く解きやすかったと思います。
なお、他の開催分の解答例はこちらを参照ください。
問1
[1]階級(P)-(S)の割合[math]19.6\%[/math]から階級(P)-(R)の割合を引くと[math]5.8\%[/math]になり「3」が適切。
[2]各階級の累積割合を計算すると階級(H)で[math]50\%[/math]を超えるので「1」が適切。
[3]階級(K), (L)までの累積割合を求め四捨五入すると[math]70\%[/math]になり「5」が適切。
問2
[4]正の相関がありややバラツキのある「4」が適切。
[5]標本共分散を[math]s_{xy}[/math], 標本標準偏差を[math]s_x, s_y[/math]とすると相関係数[math]r[/math]は[math]r=\dfrac{s_{xy}}{s_x s_y}[/math]で与えられる。ここから共分散を求めると[math]s_{xy}=147.6[/math]になり「2」が適切。
[6]変動係数(=標準偏差[math]\div[/math]平均)は変わらず、共分散は2倍になるので「2」が適切。
問3
[7]各記述は
- 標準化得点は平均0、標本不偏分散が1になるので「正」
- 標準化得点が最大になるマイアミの値を求めると2.5より大きいので「誤」
- 摂氏と華氏には線形関係があるため標準化得点は同じになり「正」
より「4」が適切。
[8][math]F=1.8C+32[/math]より平均[math]\bar{F}=1.8\times 2.4+32=36.3[/math]、標準偏差は[math]s_F=1.8\times 7.0=12.6[/math]となり「4」が適切。
問4
[9]各記述は
- 正しい記述
- 偏相関係数はある変数の影響を除いた相関関係を捉えるものなので「誤」
- 相関係数が正なら偏相関係数が負になる法則はなく「誤」
より「1」が適切。
[10]各記述は
- 偏相関係数は収入が増えた際の相関係数の増減を示すものではないため「誤」
- 同様に「誤」
- 正しい記述
より「3」が適切。
問5
[11]各記述は
- 「無作為化」の説明として正しい
- 「繰り返し」は同じ条件で複数回の実験を行うことなので「誤」
- 「局所管理」は各ブロックで条件を均一にすることなので「誤」
より「1」が適切。
問6
[12]標本抽出法の説明で正しいのは「5」。各手法の概要は「標本抽出法」を参照ください。
問7
[13]まず[math]P(A \cup B)\ne P(A)+P(B)[/math]なので排反ではない。次に[math]P(A \cap B)[/math]を求めると
[math]
P(A \cap B)=P(A)+P(B)-P(A \cup B)=0.14
[/math]
で[math]P(A \cap B)=P(A)P(B)[/math]が成立し独立。よって「2」が適切。
問8
[14]サイコロに目が3以上で赤玉が1回、白玉が1回でる確率なので[math]\frac{4}{6}\times \left(\frac{1}{5}\times\frac{4}{5}\right)\times 2=\frac{16}{75}[/math]であり「5」が適切。
[15]サイコロの目が2以下の場合に[math]X=1, 2[/math]になる確率、サイコロの目が3以上の場合に[math]X=1, 2[/math]になる確率を求め期待値を求めると[math]\frac{8}{15}[/math]になり「5」が適切。
問9
[16]まず共分散を求めると[math]Cov(X, Y)=E[XY]-E[X]E[Y]=2[/math]である。次に
[math]
\begin{eqnarray}
V[Z] &=& V[X] + V[Y] + 2Cov(X, Y) = 24\\
V[W] &=& 4V[X] + V[Y] – 4Cov(X, Y) = 24
\end{eqnarray}
[/math]
より[math]V[X], V[Y][/math]を求め[math]V[X]=E[X^2]-E[X]^2[/math]より[math]E[X^2]=5, E[Y^2]=20[/math]を得る。よって「3」が適切。
[17]相関係数[math]\rho=\frac{Cov(X,Y)}{\sqrt{V[X]V[Y]}}=\frac{1}{4}[/math]より「4」が適切。
問10
[18]1-2軒目が不在、3軒目が在宅の確率なので[math]0.8\times 0.8\times 0.2=0.128[/math]より「1」が適切。
[19][math]P(X=x)=0.8^{x-1}\times 0.2[/math]より幾何分布になり期待値は5なので「2」が適切。
問11
[20][math]\frac{X-\mu}{\sigma}[/math]は標準正規分布に従うので
[math]
\begin{eqnarray}
&&
P\left(-1 < X \leq 4\right) \\
&=& P\left(-1 < \frac{X-2}{3} \leq \frac{2}{3}\right) \\
&=& 1-Q\left(\frac{2}{3}\right)-Q(1) \\
&=& 0.59
\end{eqnarray}
[/math]
より「5」が適切。
問12
[21][math]\frac{\bar{X}-\mu}{\sqrt{S^2/n}}[/math]は自由度[math]n-1[/math]の[math]t[/math]分布に従うので
[math]
\begin{eqnarray}
&&
P(\bar{X} \geq \mu + 0.62S) \\
&=& P\left(\frac{\bar{X}-\mu}{\sqrt{S^2/9}}\geq 0.62\times 3 \right) \\
&=& 0.05
\end{eqnarray}
[/math]
より「4」が適切。
問13
[22][math]\bar{X}=3[/math]となるのは[math](X_1, X_2)=(2, 4), (4, 2)[/math]となる場合なので[math]p_3=\frac{1}{8}[/math]である。同様に[math]\bar{X}=6[/math]となるのは[math](X_1, X_2)=(4, 8), (6, 6), (8, 4)[/math]となる場合なので[math]p_6=\frac{3}{16}[/math]である。よって「4」が適切。
[23][math]\bar{X}[/math]の分布を求めると
- [math]p_2=p_8=\frac{1}{16}[/math]
- [math]p_3=p_7=\frac{2}{18}[/math]
- [math]p_4=p_6=\frac{3}{16}[/math]
- [math]p_5=\frac{4}{16}[/math]
なので中央値、最頻値ともに5になり「3」が適切。
[24]正しい記述は「5」。
問14
[25]母比率の信頼区間は
[math]
\hat{p} – z_{\alpha/2}\sqrt{\frac{
\hat{p}(1-
\hat{p})}{n}} \leq p \leq \hat{p} + z_{\alpha/2}\sqrt{\frac{
\hat{p}(1-
\hat{p})}{n}}
[/math]
で与えられる。[math] \hat{p}=\frac{20}{200}, z_{\alpha/2}=1.96, n=200[/math]より[math]95\%[/math]信頼区間は[math]0.100\pm 0.042[/math]となり「4」が適切。
問15
[26]平均[math]\mu[/math]の[math]95\%[/math]信頼区間は[math]3.23\pm t_{\alpha/2, n-1}\times \sqrt{S^2/n}[/math]で与えられ、計算すると[math]3.23\pm 3.68[/math]となり「3」が適切。
[27]対立仮説が[math]\mu > 0[/math]の片側検定であることに注意すると「3」が適切。
問16
[28]第一種過誤は[math]H_0[/math]が真の時に[math]H_0[/math]を棄却してしまう確率なので[math]X \sim \mathcal{N}(0, 1)[/math]として[math]P(X \geq 0.8)=0.212[/math]である。
第二種過誤は[math]H_1[/math]が真の時に[math]H_0[/math]を採択してしまう確率なので[math]Y \sim \mathcal{N}(1, 1)[/math]として[math]P(Y < 0.8)=P(Y-1 < -0.2)=0.421[/math]である。 以上より「2」が適切。
[29]グラフの概形をつかむために[math]x_0=0.0, 0.5, 1.0[/math]の値を求めると
- [math]\left(\beta(0.0), 1-\alpha(0.0) \right)=(0.159, 0.500)[/math]
- [math]\left(\beta(0.5), 1-\alpha(0.5) \right)=(0.309, 0.691)[/math]
- [math]\left(\beta(1.0), 1-\alpha(1.0) \right)=(0.500, 0.841)[/math]
より[math]\beta(x_0)[/math]の増加とともに[math]1-\alpha(x_0)[/math]は非線形に増加するので「1」が適切。
[30][math]x_0=0.0, 0.5, 1.0[/math]での[math]\alpha(x_0)+\beta(x_0)[/math]を求めると
- [math]\alpha(0.0)+\beta(0.0)=0.659[/math]
- [math]\alpha(0.5)+\beta(0.5)=0.618[/math]
- [math]\alpha(1.0)+\beta(1.0)=0.659[/math]
となるので「2」が適切。
問17
[31]各記述は
- 一般に[math]n[/math]個の値をとる変数は[math]n-1[/math]個のダミー変数で表現できるので「誤」
- 変数[math]U, G[/math]の回帰係数を比較し「正」
- 自由度は「観測数-回帰係数の数=16-4=12」なので「誤」
より「2」が適切。
[32]各記述は
- 教育年数[math]x[/math]の回帰係数より「正」
- 単回帰モデルでも決定係数と自由度調整済み決定係数は異なるので「誤」
- 両側検定と片側検定で[math]P[/math]値は異なるので「誤」
より「1」が適切。
[33]各記述は
- 説明変数の異なるモデルの比較には決定係数は使えないため「誤」
- 正しい説明
- 正しい説明
より「5」が適切。
問18
[34]いずれの回帰係数の[math]P[/math]値も[math]0.05[/math]より小さく「5」が適切。
[35]変数carの回帰係数はマイナスになっており「3」の説明が適切。