コメント
大問3は重回帰モデルの最小二乗推定量に関する問題が出題されました。
相関係数との関連や推定量の分散など教科書で登場する内容なので重回帰分析を勉強してきた人には難しくないと思います。ただ、問題量が多く時間内に完答するのは意外と大変な問題セットだと思います。
問題
y=β0+β1x1+β2x2+ϵ
を考える。ここでy, x1, x2∈Rnであり、
- 標本平均はともに0、つまりeTx1=eTx2=0
- E[ϵi]=0
- Cov[ϵi, ϵj]=σ2δij
- r12: x1とx2の相関係数で|r12|<1
- rky: xkとyの相関係数
- Ski=xkTxl
- Sky=xkTy
とする。ここでe=(1 1 …1)T∈Rn, δij={1(i=j)0(i≠j)である。この時、以下の問に答えよ。
(出典:「統計検定 1級・準1級 公式問題集」。問題文を一部略記。)
問1
X=(e x1 x2)とおくと正規方程式は
XTX(ˆβ0ˆβ1ˆβ2)=XTy
で与えられる。
XTX=(n000S11S120S21S22)
および
XTy=(eTyS1yS2y)
なので
(S11S12S21S22)(ˆβ1ˆβ2)=(S1yS2y)
を解いて
ˆβ1=S22S1y−S12S2yS11S22−S212ˆβ2=−S12S1y+S11S2yS11S22−S212
を得る。
問2
Syy=∑ni=1(yi−ˉy)2, ˉy=eTynとおくとr12=S12√S11S22, r1y=S1y√S11Syy, r2y=S2y√S22Syyなのでˆβ1からS12,S1y,S2yを消去して整理すると
ˆβ1=√SyyS11r1y−r12r2y1−r212
を得る。分母は|r12|<1より常に正なのでˆβ1<0となるための必要十分条件はr1y−r12r2y<0である。r1y>0, r2y>0の場合を考えるとr1y<r2yでありr12≈1の時、r1y−r12r2y<0が成立しˆβ1<0となる。
問3
V[ˆβ1], V[ˆβ2]は分散共分散行列σ2(XTX)−1の第2, 3対角成分なので
V[ˆβ1]=σ2S22S11S22−S212V[ˆβ2]=σ2S11S11S22−S212
である。ここでr12を用いて表現すると
V[ˆβ1]=σ2S1111−r212V[ˆβ2]=σ2S2211−r212
であり、11−r212はr12=0の時が最小で|r12|が1に近づくにつれ大きくなるのでr12=0の時の分散V[ˆβ1],V[ˆβ2]が最小で|r12|が1に近づくにつれ分散は大きくなる。
問4
V[yi]=σ2より
V[˜β1]=1S211n∑i=1x21iV[yi]=σ2S211n∑i=1x21i=σ2S11
なので
V[ˆβ1]−V[˜β1]=σ2S1111−r212–σ2S11=σ2S1111/r212−1
となり、r212の増加関数である。
次に
E[˜β1]=1S11E[S1y]=1S11x1T(β0e+β1x1+β2x2)=1S11(β1S11+β2S12)=β1+β2S12S11
である。これより˜β1のMSEを求めると
MSE[˜β1]=E[(˜β1–β1)2]=E[(˜β1–E[˜β1]–(β1−E[˜β1]))2]=V[˜β1]+E[(β1−E[˜β1])2]=σ2S11+β22(S12S11)2
である。
最小二乗推定量ˆβ1はβ1の不偏推定量なので
MSE[ˆβ1]=V[ˆβ1]=σ2S1111−r212
である。これより
MSE[ˆβ1]−MSE[˜β1]=σ2S11r2121−r212–β22(S12S11)2=(S12S11)2(σ2S11S212r2121−r212−β22)
でありr12=S12√S11S22なので
r2121−r212=S212S11S22(1−r212)
に注意すると
(S12S11)2(σ2S11S212r2121−r212−β22)=(S12S11)2(σ2S2211−r212−β22)=(S12S11)2(V[^β2]−β22)
を得る。以上よりMSE[ˆβ1], MSE[˜β1]の大小はV[^β2], β22の大小と一致する。
シリーズ記事
- 過去問と解答例
- 2015年(統計数理)大問1
- 2015年(統計数理)大問1 解答例
- 2015年(統計数理)大問2
- 2015年(統計数理)大問2 解答例
- 2015年(統計数理)大問3
- 2015年(統計数理)大問3 解答例(本記事)