【統計検定1級過去問】2019年（統計数理）大問1 解答例

大偏差原理を背景に二項分布の裾の振る舞いを確率母関数で評価する問題でした。

ここ数年、大問1は「選択しないのが正解」と言いたくなる難問が多かったのですが今年は丁寧な誘導がついており内容の深さ、難易度のバランスの取れた良問だと思います。

問題

非負の整数値をとる離散型確率変数[math]X[/math]に対し確率母関数を

[math]
 G_X(t) = E\left[ t^X \right] = \sum_{k}t^k P(X = k)\quad (-1 \leq t \leq 1)
[/math]

で定義する。この時、以下の問いに答えよ。

（出典：統計検定HP「統計検定 1級の過去問題」。問題文を一部略記。）

問1

[math]X[/math]の期待値、分散を[math]G^{\prime}_X(t), G^{\prime\prime}_X(t)[/math]を用いて表せ。

[math]G_X(t)=\sum_{k}t^k P(X = k)[/math]を[math]t[/math]で微分すると

[math]
G^{\prime}_X(t) =  \sum_{k}kt^{k-1} P(X = k)
[/math]

なので[math]E[X]= \sum_{k}k P(X = k)=G^{\prime}(1)[/math]である。

次に[math]G_X(t)[/math]を[math]t[/math]で二階微分すると

[math]
 G^{\prime\prime}_X(t) =  \sum_{k}k(k-1)t^{k-2} P(X = k)
[/math]

より

[math]
\begin{eqnarray}
  G^{\prime\prime}_X(1) &=&  \sum_{k}k(k-1)P(X = k) \\
&=& E[X(X-1)] \\
&=& E\left[X^2\right] – E[X]
\end{eqnarray}
[/math]

なので分散[math]V[X][/math]は

[math]
\begin{eqnarray}
 V[X] &=& E\left[X^2\right] – E[X]^2 \\
&=& G^{\prime\prime}_X(1) + G^{\prime}_X(1) – G^{\prime}_X(1)^2
\end{eqnarray}
[/math]

である。

問2

[math]X[/math]が二項分布[math]B(n,p)[/math]に従う時、[math]G_X(t)[/math]と期待値、分散を求めよ。

[math]P(X=k) = {}_nC_{k}p^k(1-p)^{n-k}[/math]より

[math]
\begin{eqnarray}
 G_X(t) &=& \sum_{k}t^k {}_nC_{k}p^k(1-p)^{n-k} \\
&=& \sum_{k} {}_nC_{k}(tp)^k(1-p)^{n-k} \\
&=& (tp + 1 – p)^n
\end{eqnarray}
[/math]

である。これより

[math]
\begin{eqnarray}
 G^{\prime}_X(t) &=& np(tp + 1 – p)^{n-1} \\
 G^{\prime\prime}_X(t)&=& n(n-1)p^2(tp + 1 – p)^{n-2}
\end{eqnarray}
[/math]

なので

[math]
\begin{eqnarray}
 G^{\prime}_X(1) &=& np \\
 G^{\prime\prime}_X(1)&=& n(n-1)p^2
\end{eqnarray}
[/math]

となり

[math]
\begin{eqnarray}
 E[X] &=&  G^{\prime}_X(1) = np \\
V[X] &=& G^{\prime\prime}_X(1) + G^{\prime}_X(1) – G^{\prime}_X(1)^2 \\
&=& n(n-1)p^2 + np – n^2p^2 \\
&=& np(1-p)
\end{eqnarray}
[/math]

を得る。

問3

正の実数[math]r[/math]とすべての[math]0< t \leq 1[/math]に対し

[math]
 P(X \leq r) \leq t^{-r} G_X(t)
[/math]

が成立することを示せ。（ヒント: [math]G_X(t)[/math]の定義の和を[math]k\leq r[/math]と[math]k > r[/math]に分ける。）

[math]s = \lfloor r \rfloor[/math]とおくと[math]s \geq 0[/math]であり[math]t^k > 0[/math]より

[math]
\begin{eqnarray}
 G_X(t) &=& \sum_{k \leq s} t^k P(X = k) + \sum_{k > s} t^k P(X = k) \\
& \geq & \sum_{k \leq s} t^k P(X = k)
\end{eqnarray}
[/math]

であり[math]k \leq s \leq r[/math]および[math]t \leq 1[/math]より[math]t^k \geq t^r[/math]なので

[math]
\begin{eqnarray}
 \sum_{k \leq s} t^k P(X = k) & \geq &  t^r\sum_{k \leq s} P(X = k) \\
&=& t^r P(X \leq s) \\
&=& t^r P(X \leq r)
\end{eqnarray}
[/math]

を得る。これより

[math]
 P(X \leq r) \leq t^{-r} G_X(t)
[/math]

が成立する。

問4

[math]X[/math]が二項分布[math]B(n,p)[/math]に従う時、実数[math]0 < a < p[/math]に対し

[math]
 P(X \leq an) \leq \left(\dfrac{p}{a}\right)^{an}\left(\dfrac{1-p}{1-a}\right)^{(1-a)n}
[/math]

が成立することを示せ。（ヒント: 問3の右辺の[math]t[/math]に関する最小値を求める。）

この結果から[math]a=k/n[/math]とおくと（ただし、[math]k < np[/math]）

[math]
\begin{eqnarray}
 P(X \leq k) \leq n^n \left(\dfrac{p}{k}\right)^k\left(\dfrac{1-p}{n-k}\right)^{n-k}
\end{eqnarray}
[/math]

二項分布の裾の確率を上から評価することができます。

[math]r=an[/math]とおくと[math]r>0[/math]であり問2, 3の結果から

[math]
\begin{eqnarray}
P(X \leq an) &\leq& t^{-an}G_X(t) \\
&=& t^{-an}(tp + 1 – p)^n
\end{eqnarray}
[/math]

が[math]0 < t \leq 1[/math]で成立する。ここで[math]f(t)=t^{-an}(tp + 1 - p)^n[/math]とおき最小値を求める。

[math]
\log f(t) = -an\log t + n \log(tp+1-p)
[/math]

であり[math]t[/math]で微分して

[math]
\begin{eqnarray}
\dfrac{d}{dt}\log f(t) &=& -\dfrac{an}{t} + \dfrac{np}{tp+1-p} \\
&=& 0
\end{eqnarray}
[/math]

を解くと[math]s = \dfrac{a}{p}\cdot\dfrac{1-p}{1-a}[/math]であり[math]0 < a < p[/math]より[math]0 < s < 1[/math]なので[math]t=s[/math]で最小値をとる。

[math]
\begin{eqnarray}
f(s) &=& s^{-an}(sp+1-p)^n \\
&=& \left(\dfrac{p}{a}\right)^{an} \left(\dfrac{1-a}{1-p}\right)^{an}\left(\dfrac{1-p}{1-a}\right)^n \\
&=& \left(\dfrac{p}{a}\right)^{an}\left(\dfrac{1-p}{1-a}\right)^{(1-a)n}
\end{eqnarray}
[/math]

なので

[math]
 P(X \leq an) \leq \left(\dfrac{p}{a}\right)^{an}\left(\dfrac{1-p}{1-a}\right)^{(1-a)n}
[/math]

が成立する。

シリーズ記事