定義
十分統計量はフィッシャーにより導入された統計的推定における基本的な概念で以下の性質を持つ統計量のことを指します。
十分統計量の意味
統計量[math]T(X)[/math]の情報が与えられると[math]X[/math]の条件付き分布はもはや[math]\theta[/math]に依存しないことを意味しています。尤度法に基づくパラメータ[math]\theta[/math]の推定では、標本[math]X[/math]に関するすべての情報がなくても十分統計量[math]T(X)[/math]さえ分かれば良いことが知られており、その意味で十分統計量[math]T(X)[/math]はパラメータ[math]\theta[/math]の推定に必要な情報をすべて持った統計量と言えます。
例えば、ベルヌーイ試行[math](p)[/math]の確率[math]p[/math]に対して標本平均[math]\frac{1}{n}\sum_{i=1}^nX_i[/math]は十分統計量であることが知られています。これは、確率[math]p[/math]を推定する際に各試行の個別の結果[math]X_i[/math]が分からなくても標本平均が分かれば推定できることを意味しており、標本平均がベルヌーイ試行のパラメータ[math]p[/math]を推定するために十分な情報量を持っているというのは直感ともあっています。
十分統計量の問題
統計検定で十分統計量に関する問題が出題されたことは私が知る限りではないのですが、出題範囲に含まれているのでそろそろ出題されるのでは?と思います。出題形式としては
- 与えられた分布とそのパラメータ[math]\theta[/math]に対する十分統計量を求めさせる問題
- ある統計量が十分統計量であることを証明させる問題
が想定されます。いずれの形式も確率密度関数が与えられている場合、次の定石が使えます。
十分統計量の定石
確率密度関数が与えられている場合、「フィッシャー・ネイマンの分解定理」を用いるのが定石です。
となる関数[math]f,g[/math]が存在することである。
つまり、確率密度関数が
- パラメータ[math]\theta[/math]に依存しない関数
- [math]T(x)[/math]と[math]\theta[/math]の関数
の積に分解できることを示すことで統計量[math]T(x)[/math]が十分統計量であることを示せます。確率密度関数を式変形するだけで良いので、統計量[math]T(x)[/math]が十分統計量の定義に合致することを示すより容易に示すことが可能です。
例題
冒頭でも触れた次の命題をフィッシャー・ネイマンの分解定理を使って示してみましょう。
確率変数[math]X_i\in\{0,\ 1\}[/math]がベルヌーイ試行[math](p)[/math]に従うとすると確率密度関数は
[math]
\begin{eqnarray}
&&f(x|p) \\
&=& \prod_{i=1}^np^{x_i}(1-p)^{1-x_i} \\
&=& p^{\sum_{i=1}^n x_i}(1-p)^{n-\sum_{i=1}^n x_i} \\
&=& p^{nt}(1-p)^{n-nt}\quad \left(t=\frac{1}{n}\sum_{i=1}^n x_i\right)
\end{eqnarray}
[/math]
と書け[math]h(x)=1[/math], [math]g(T(x)|p)=p^{nT(x)}(1-p)^{n-nT(x)}[/math]とおくと
[math]
f(x|p)=h(x)g(T(x)|p)
[/math]
と分解できるのでフィッシャー・ネイマンの分解定理から標本平均[math]T(x)=\frac{1}{n}\sum_{i=1}^nX_i[/math]は十分統計量になります。
ありがとうございます。 仮説検定のページとても分かりやすかったです! よろしければ実際に確率密度関数に分解定理を使う例をいくつか見せてもらえますか。 よろしくお願いします。
コメントありがとうございます。例題を追加しました。
h(x)=1として証明する方法ってありなんですかね。。
そうすると確率密度関数がどんな形であれ、h(x) x otherと表せられてしまうのでは、という疑問がわくのですが、、
記事中にもありますが、フィッシャー・ネイマンの分解定理が使えるのは確率密度関数が
・パラメータθに依存しない関数
・統計量T(x)とθの関数
の積の形にかける時のみです。
h(x)=1と置くと確率密度関数がどんな形であれ「h(x) x other」の形に書けますが、”other”が「統計量T(x)とθの関数」の形になっていなければフィッシャー・ネイマンの分解定理を使うことはできません。