コメント
大偏差原理を背景に二項分布の裾の振る舞いを確率母関数で評価する問題でした。
ここ数年、大問1は「選択しないのが正解」と言いたくなる難問が多かったのですが今年は丁寧な誘導がついており内容の深さ、難易度のバランスの取れた良問だと思います。
問題
[math]
G_X(t) = E\left[ t^X \right] = \sum_{k}t^k P(X = k)\quad (-1 \leq t \leq 1)
[/math]
で定義する。この時、以下の問いに答えよ。
(出典:統計検定HP「統計検定 1級の過去問題」。問題文を一部略記。)
問1
[math]G_X(t)=\sum_{k}t^k P(X = k)[/math]を[math]t[/math]で微分すると
[math]
G^{\prime}_X(t) =
\sum_{k}kt^{k-1} P(X = k)
[/math]
なので[math]E[X]= \sum_{k}k P(X = k)=G^{\prime}(1)[/math]である。
次に[math]G_X(t)[/math]を[math]t[/math]で二階微分すると
[math]
G^{\prime\prime}_X(t) =
\sum_{k}k(k-1)t^{k-2} P(X = k)
[/math]
より
[math]
\begin{eqnarray}
G^{\prime\prime}_X(1) &=&
\sum_{k}k(k-1)P(X = k) \\
&=& E[X(X-1)] \\
&=& E\left[X^2\right] – E[X]
\end{eqnarray}
[/math]
なので分散[math]V[X][/math]は
[math]
\begin{eqnarray}
V[X] &=& E\left[X^2\right] – E[X]^2 \\
&=& G^{\prime\prime}_X(1) + G^{\prime}_X(1) – G^{\prime}_X(1)^2
\end{eqnarray}
[/math]
である。
問2
[math]P(X=k) = {}_nC_{k}p^k(1-p)^{n-k}[/math]より
[math]
\begin{eqnarray}
G_X(t) &=& \sum_{k}t^k {}_nC_{k}p^k(1-p)^{n-k} \\
&=& \sum_{k} {}_nC_{k}(tp)^k(1-p)^{n-k} \\
&=& (tp + 1 – p)^n
\end{eqnarray}
[/math]
である。これより
[math]
\begin{eqnarray}
G^{\prime}_X(t) &=& np(tp + 1 – p)^{n-1} \\
G^{\prime\prime}_X(t)&=& n(n-1)p^2(tp + 1 – p)^{n-2}
\end{eqnarray}
[/math]
なので
[math]
\begin{eqnarray}
G^{\prime}_X(1) &=& np \\
G^{\prime\prime}_X(1)&=& n(n-1)p^2
\end{eqnarray}
[/math]
となり
[math]
\begin{eqnarray}
E[X] &=&
G^{\prime}_X(1) = np \\
V[X] &=& G^{\prime\prime}_X(1) + G^{\prime}_X(1) – G^{\prime}_X(1)^2 \\
&=& n(n-1)p^2 + np – n^2p^2 \\
&=& np(1-p)
\end{eqnarray}
[/math]
を得る。
問3
[math]
P(X \leq r) \leq t^{-r} G_X(t)
[/math]
が成立することを示せ。(ヒント: [math]G_X(t)[/math]の定義の和を[math]k\leq r[/math]と[math]k > r[/math]に分ける。)
[math]s = \lfloor r \rfloor[/math]とおくと[math]s \geq 0[/math]であり[math]t^k > 0[/math]より
[math]
\begin{eqnarray}
G_X(t) &=& \sum_{k \leq s} t^k P(X = k) + \sum_{k > s} t^k P(X = k) \\
& \geq & \sum_{k \leq s} t^k P(X = k)
\end{eqnarray}
[/math]
であり[math]k \leq s \leq r[/math]および[math]t \leq 1[/math]より[math]t^k \geq t^r[/math]なので
[math]
\begin{eqnarray}
\sum_{k \leq s} t^k P(X = k) & \geq &
t^r\sum_{k \leq s} P(X = k) \\
&=& t^r P(X \leq s) \\
&=& t^r P(X \leq r)
\end{eqnarray}
[/math]
を得る。これより
[math]
P(X \leq r) \leq t^{-r}
G_X(t)
[/math]
が成立する。
問4
[math]
P(X \leq an) \leq \left(\dfrac{p}{a}\right)^{an}\left(\dfrac{1-p}{1-a}\right)^{(1-a)n}
[/math]
が成立することを示せ。(ヒント: 問3の右辺の[math]t[/math]に関する最小値を求める。)
[math]
\begin{eqnarray}
P(X \leq k) \leq n^n \left(\dfrac{p}{k}\right)^k\left(\dfrac{1-p}{n-k}\right)^{n-k}
\end{eqnarray}
[/math]
二項分布の裾の確率を上から評価することができます。
[math]r=an[/math]とおくと[math]r>0[/math]であり問2, 3の結果から
[math]
\begin{eqnarray}
P(X \leq an) &\leq& t^{-an}G_X(t) \\
&=& t^{-an}(tp + 1 – p)^n
\end{eqnarray}
[/math]
が[math]0 < t \leq 1[/math]で成立する。ここで[math]f(t)=t^{-an}(tp + 1 - p)^n[/math]とおき最小値を求める。
[math]
\log f(t) = -an\log t + n \log(tp+1-p)
[/math]
であり[math]t[/math]で微分して
[math]
\begin{eqnarray}
\dfrac{d}{dt}\log f(t) &=& -\dfrac{an}{t} + \dfrac{np}{tp+1-p} \\
&=& 0
\end{eqnarray}
[/math]
を解くと[math]s = \dfrac{a}{p}\cdot\dfrac{1-p}{1-a}[/math]であり[math]0 < a < p[/math]より[math]0 < s < 1[/math]なので[math]t=s[/math]で最小値をとる。
[math]
\begin{eqnarray}
f(s) &=& s^{-an}(sp+1-p)^n \\
&=& \left(\dfrac{p}{a}\right)^{an} \left(\dfrac{1-a}{1-p}\right)^{an}\left(\dfrac{1-p}{1-a}\right)^n \\
&=& \left(\dfrac{p}{a}\right)^{an}\left(\dfrac{1-p}{1-a}\right)^{(1-a)n}
\end{eqnarray}
[/math]
なので
[math]
P(X \leq an) \leq \left(\dfrac{p}{a}\right)^{an}\left(\dfrac{1-p}{1-a}\right)^{(1-a)n}
[/math]
が成立する。
シリーズ記事
- 過去問と解答例
- 2019年(統計数理)大問1
- 2019年(統計数理)大問1 解答例(本記事)
- 2019年(統計数理)大問2
- 2019年(統計数理)大問2 解答例
- 2019年(統計数理)大問4
- 2019年(統計数理)大問4 解答例
問4に関して質問なのですが、単調増加関数である対数関数を微分してなぜ最小値が求められるのでしょうか?
[math]f(t)>0[/math]である関数に対して[math]\dfrac{d}{dt}\log f(t)=\dfrac{f'(t)}{f(t)}[/math]なので[math]f'(t)=0[/math]と[math]\dfrac{d}{dt}\log f(t)=0[/math]は同値になるためです。