blueblog

宇宙一統計ができない農学系M1の勉強用ブログ

2014年度統計検定1級 大問1(統計数理)

注)僕が今年受けるかどうかは未定です。

ぼちぼちkaggleをやりながら統計検定1級の勉強をしているのですが、日本統計学会の出している昨年度の略解(
http://www.toukei-kentei.jp/about/pastpaper/2014n/ans2014n_grade1_suri.pdf
)のあまりの不親切さと未だに刊行されない2014年度版過去問集に憤りを覚えたのでまとめてみます。
なお、以下のブログを大いに参考にしています。blog.goo.ne.jp

先駆者がいらっしゃることですし、本ブログの方針に則り、できるだけ詳しく展開を書くことで差別化を図ろうと思います。

おことわり
・勉強がてら調べつつ解いていくつもりなので内容の正確さはかなり微妙ですのでご了承下さい。間違いに対するご指摘・お叱りは歓迎致します。
・2014年度分が解説付きで過去問集に掲載された後に関してですが、著作権等で問題があるようならばこれらの記事を削除します。(試験問題とその解説ってどういう扱いなんでしょうかね?これがだめならPRMLの方もダメな気がする。。。)

大問1(問題)

区間(0,1)上の一様分布に従う互いに独立な確率変数 U, V, W に対し、 \alpha, \beta, \gamma を正の定数として、
 X=U^\alpha, Y=V^\beta, Z=W^\gamma とする。このとき以下の設問に答えよ

(1) \alpha=2,\beta=3のとき、 U=uが与えられた下での条件付き確率 P(X>Y|U=u)を求めよ。
これを用いて X>Yとなる確率 P(X>Y)を求めよ。

(2)一般の \alpha, \beta, \gamma に対し、X X, Y, Zの中で最大となる確率P(X=max(X,Y,Z))を求めよ。

(3)上問(2)を拡張し、 U_i(i = 1,...,n) を互いに独立に区間(0,1) 上の一様分布に従うn個の確率変数とし、\alpha_i(i = 1,...,n) を正の定数として、 X_i=U_i^{\alpha_i}(i = 1,...,n)とするとき、 X_1X_1,...,X_n の中で最大となる確率 P(X_1=max(X_1,...,X_n))\alpha_1,...,\alpha_n の関数として求めよ。

解説

(1)

 U=uが与えられた下でのVの確率を vとします。
 \alpha=2,\beta=3が与えられていますから、 X>Yが成り立つ時、
 u,vには 1>u^2>v^3>0の関係があります。
ここで、 u,vは確率なので0から1の範囲をとりますから三乗根をとっても不等号は変わらず
 u^{2/3}>v>0
が成り立ちます。
よって uが与えられた時、vのとりうる範囲は u^{2/3}>v>0 [1]。
Vは区間(0,1)上の一様分布なので、vが[1]の範囲にある確率は \frac{u^{2/3}-0}{1-0}=u^{2/3}
(もっと詳しく言えば、「始点0、終点1の長さ1の線分上における、0から u^{2/3}までの部分が占める割合」というイメージです)
以上より条件付き確率 P(X>Y|U=u)( U=uという条件が与えられた下で、確率変数Xが確率変数Yよりも大きくなる確率)は u^{2/3}となります。

あとは P(X>Y)を求めますが、ここまでくれば簡単で、あり得る全ての uの場合の条件付き確率 P(X>Y|U=u)を足し合わせればよいです。つまり積分すればいいですね。 uが確率だったことを思い出すと、積分区間は0から1までで良いとわかります。
 P(X>Y)=\int_0^1P(X>Y|U=u)du=\int_0^1 u^{2/3}du=[\frac{3}{5}u^{5/3} ]_0^1=\frac{3}{5}
より、 P(X>Y)=\frac{3}{5}とわかります。

(2)

P(X=max(X,Y,Z))となる確率を求める問題ですが、このままでは少なくとも僕には解けないので P(X>max(Y,Z))と読み替えます。
(ここの部分は2014年度、統計数理、問1の解説 - the BLOG for 統計検定1級を読んでようやく理解しました)
(左の式は「X,Y,Zの中でXが最大となる確率」、右の式は「XがYとZの最大値よりも大きい確率」という意味です。どちらも同じですよね?)

(1)に倣って、 U=uが与えられた下での条件付き確率 P(X>max(Y,Z)|U=u)を求めて積分する方針でいきましょう。
 U=uが与えられた時の V,Wの確率をそれぞれ v,wとすると、
 u^\alpha>max(v^\beta,w^\gamma)となる v,wの条件を調べれば良さそうです。
maxが邪魔なので、ひとまずこれを取り払って u^\alpha>v^\beta u^\alpha>w^\gammaに分解して考えましょう。
 u^\alpha>v^\betaを満たす確率(すなわち P(X>Y|U=u))は(1)と同様に、 u^{\alpha/\beta}>v>0から、
 u^{\alpha/\beta} [2]。
 u^\alpha>w^\gammaを満たす確率(すなわち P(X>Z|U=u))は(1)と同様に、 u^{\alpha/\gamma}>w>0から、
 u^{\alpha/\gamma} [3]。

ここで少し考えると、「 u^\alphaが、 v^\beta w^\gammaの最大値よりも大きい」ということは「 u^\alphaが、 u^\alpha>v^\betaかつ u^\alpha>w^\gammaを満たす」ということと同じであると気づきます。
したがって、 u^\alpha>max(v^\beta,w^\gamma)となる確率(すなわち P(X>max(Y,Z)|U=u))は、[2],[3]の同時確率より、
 u^{\alpha/\beta}*u^{\alpha/\gamma}=u^{\frac{\alpha\gamma+\alpha\beta}{\beta\gamma}}
あとは積分して、
{\displaystyle
\begin{eqnarray*}
P(X>max(Y,Z))
&=&\int_0^1 P(X>max(Y,Z)|U=u)du\\
&=& \int_0^1 u^{\frac{\alpha\gamma+\alpha\beta}{\beta\gamma}} du\\
&=&[\frac{\beta\gamma}{\alpha\gamma+\alpha\beta+\beta\gamma}u^\frac{\alpha\gamma+\alpha\beta+\beta\gamma}{\beta\gamma}]_0^1\\
&=&\frac{\beta\gamma}{\alpha\gamma+\alpha\beta+\beta\gamma}
\end{eqnarray*}
}
より、
{\displaystyle
P(X=max(X,Y,Z))=P(X>max(Y,Z))=\frac{\beta\gamma}{\alpha\gamma+\alpha\beta+\beta\gamma}=\frac{1/\alpha}{1/\alpha+1/\beta+1/\gamma}
}
とわかります。

(3)

(2)が解ければボーナス問題です。
 U_1=u_1の下での条件付き確率 P(X_1=max(X_1,...,X_n)|U_1=u_1)は、(2)での議論から、
 u_1^{\alpha_1}が、 u_1^{\alpha_1}>u_2^{\alpha_2},..., u_1^{\alpha_1}>u_n^{\alpha_n}を同時に満たす確率」と同じ意味なので、
(2)と同様に
 u_1^{\alpha_1/\alpha_2},..., u_1^{\alpha_1/\alpha_n}
を掛けあわせて
 P(X_1=max(X_1,...,X_n)|U_1=u_1)=u_1^{\alpha_1/\alpha_2+...+\alpha_1/\alpha_n}
これを積分して
 P(X_1=max(X_1,...,X_n))=\int_0^1 P(X_1=max(X_1,...,X_n)|U_1=u_1)du_1=\frac{1/\alpha_1}{1/\alpha_1+...+1/\alpha_n}
と求まります。


以下公式参考書等の紹介です(踏んで買って頂けたら嬉しいですが、そこそこお高いと思うので慎重にご判断下さい)

2012年度と2013年度については公式解説集があります。まだ施行歴が浅いため統計検定の過去問は2年分だけで、あとはRSS/JSSとの抱き合わせになっていますのでご注意を。

公式の参考書もあります。コンパクトに試験範囲が網羅されている反面、残念ながら定理の証明がかなり略されているのでもし使うなら試験範囲の確認用として、細かいところは他の本(統計学入門とか)で詰めた方が良いような気がします。僕は証明をしながら進めようとしたら全然読み終わらなくてヤバイヤバイ言ってます。