2014年度統計検定1級大問1(統計数理)

注)僕が今年受けるかどうかは未定です。

ぼちぼちkaggleをやりながら統計検定1級の勉強をしているのですが、日本統計学会の出している昨年度の略解(
http://www.toukei-kentei.jp/about/pastpaper/2014n/ans2014n_grade1_suri.pdf
)のあまりの不親切さと未だに刊行されない2014年度版過去問集に憤りを覚えたのでまとめてみます。
なお、以下のブログを大いに参考にしています。blog.goo.ne.jp

先駆者がいらっしゃることですし、本ブログの方針に則り、できるだけ詳しく展開を書くことで差別化を図ろうと思います。

おことわり
・勉強がてら調べつつ解いていくつもりなので内容の正確さはかなり微妙ですのでご了承下さい。間違いに対するご指摘・お叱りは歓迎致します。
・2014年度分が解説付きで過去問集に掲載された後に関してですが、著作権等で問題があるようならばこれらの記事を削除します。(試験問題とその解説ってどういう扱いなんでしょうかね？これがだめならPRMLの方もダメな気がする。。。)

大問1(問題)

区間(0,1)上の一様分布に従う互いに独立な確率変数 $U, V, W$ に対し、 $\alpha, \beta, \gamma$ を正の定数として、
$X=U^\alpha, Y=V^\beta, Z=W^\gamma$ とする。このとき以下の設問に答えよ

(1) $\alpha=2,\beta=3$ のとき、 $U=u$ が与えられた下での条件付き確率 $P(X>Y|U=u)$ を求めよ。
これを用いて $X>Y$ となる確率 $P(X>Y)$ を求めよ。

(2)一般の $\alpha, \beta, \gamma$ に対し、 $X$ が $X, Y, Z$ の中で最大となる確率 $P(X=max(X,Y,Z))$ を求めよ。

(3)上問(2)を拡張し、 $U_i(i = 1,...,n)$ を互いに独立に区間(0,1) 上の一様分布に従う $n$ 個の確率変数とし、 $\alpha_i(i = 1,...,n)$ を正の定数として、 $X_i=U_i^{\alpha_i}(i = 1,...,n)$ とするとき、 $X_1$ が $X_1,...,X_n$ の中で最大となる確率 $P(X_1=max(X_1,...,X_n))$ を $\alpha_1,...,\alpha_n$ の関数として求めよ。

解説

(1)

$U=u$ が与えられた下でのVの確率を $v$ とします。
$\alpha=2,\beta=3$ が与えられていますから、 $X>Y$ が成り立つ時、
$u,v$ には $1>u^2>v^3>0$ の関係があります。
ここで、 $u,v$ は確率なので0から1の範囲をとりますから三乗根をとっても不等号は変わらず
$u^{2/3}>v>0$
が成り立ちます。
よって $u$ が与えられた時、vのとりうる範囲は $u^{2/3}>v>0$ [1]。
Vは区間(0,1)上の一様分布なので、vが[1]の範囲にある確率は $\frac{u^{2/3}-0}{1-0}=u^{2/3}$ 。
(もっと詳しく言えば、「始点0、終点1の長さ1の線分上における、0から $u^{2/3}$ までの部分が占める割合」というイメージです)
以上より条件付き確率 $P(X>Y|U=u)$ ( $U=u$ という条件が与えられた下で、確率変数Xが確率変数Yよりも大きくなる確率)は $u^{2/3}$ となります。

あとは $P(X>Y)$ を求めますが、ここまでくれば簡単で、あり得る全ての $u$ の場合の条件付き確率 $P(X>Y|U=u)$ を足し合わせればよいです。つまり積分すればいいですね。 $u$ が確率だったことを思い出すと、積分区間は0から1までで良いとわかります。
$P(X>Y)=\int_0^1P(X>Y|U=u)du=\int_0^1 u^{2/3}du=[\frac{3}{5}u^{5/3} ]_0^1=\frac{3}{5}$
より、 $P(X>Y)=\frac{3}{5}$ とわかります。

(2)

$P(X=max(X,Y,Z))$ となる確率を求める問題ですが、このままでは少なくとも僕には解けないので $P(X>max(Y,Z))$ と読み替えます。
(ここの部分は2014年度、統計数理、問１の解説 - the BLOG for 統計検定1級を読んでようやく理解しました)
(左の式は「X,Y,Zの中でXが最大となる確率」、右の式は「XがYとZの最大値よりも大きい確率」という意味です。どちらも同じですよね？)

(1)に倣って、 $U=u$ が与えられた下での条件付き確率 $P(X>max(Y,Z)|U=u)$ を求めて積分する方針でいきましょう。
$U=u$ が与えられた時の $V,W$ の確率をそれぞれ $v,w$ とすると、
$u^\alpha>max(v^\beta,w^\gamma)$ となる $v,w$ の条件を調べれば良さそうです。
maxが邪魔なので、ひとまずこれを取り払って $u^\alpha>v^\beta$ と $u^\alpha>w^\gamma$ に分解して考えましょう。
$u^\alpha>v^\beta$ を満たす確率(すなわち $P(X>Y|U=u)$ )は(1)と同様に、 $u^{\alpha/\beta}>v>0$ から、
$u^{\alpha/\beta}$ [2]。
$u^\alpha>w^\gamma$ を満たす確率(すなわち $P(X>Z|U=u)$ )は(1)と同様に、 $u^{\alpha/\gamma}>w>0$ から、
$u^{\alpha/\gamma}$ [3]。

ここで少し考えると、「 $u^\alpha$ が、 $v^\beta$ と $w^\gamma$ の最大値よりも大きい」ということは「 $u^\alpha$ が、 $u^\alpha>v^\beta$ かつ $u^\alpha>w^\gamma$ を満たす」ということと同じであると気づきます。
したがって、 $u^\alpha>max(v^\beta,w^\gamma)$ となる確率(すなわち $P(X>max(Y,Z)|U=u)$ )は、[2],[3]の同時確率より、
$u^{\alpha/\beta}*u^{\alpha/\gamma}=u^{\frac{\alpha\gamma+\alpha\beta}{\beta\gamma}}$
あとは積分して、
${\displaystyle \begin{eqnarray*} P(X>max(Y,Z)) &=&\int_0^1 P(X>max(Y,Z)|U=u)du\\ &=& \int_0^1 u^{\frac{\alpha\gamma+\alpha\beta}{\beta\gamma}} du\\ &=&[\frac{\beta\gamma}{\alpha\gamma+\alpha\beta+\beta\gamma}u^\frac{\alpha\gamma+\alpha\beta+\beta\gamma}{\beta\gamma}]_0^1\\ &=&\frac{\beta\gamma}{\alpha\gamma+\alpha\beta+\beta\gamma} \end{eqnarray*} }$
より、
${\displaystyle P(X=max(X,Y,Z))=P(X>max(Y,Z))=\frac{\beta\gamma}{\alpha\gamma+\alpha\beta+\beta\gamma}=\frac{1/\alpha}{1/\alpha+1/\beta+1/\gamma} }$
とわかります。

(3)

(2)が解ければボーナス問題です。
$U_1=u_1$ の下での条件付き確率 $P(X_1=max(X_1,...,X_n)|U_1=u_1)$ は、(2)での議論から、
「 $u_1^{\alpha_1}$ が、 $u_1^{\alpha_1}>u_2^{\alpha_2}$ ,..., $u_1^{\alpha_1}>u_n^{\alpha_n}$ を同時に満たす確率」と同じ意味なので、
(2)と同様に
$u_1^{\alpha_1/\alpha_2}$ ,..., $u_1^{\alpha_1/\alpha_n}$
を掛けあわせて
$P(X_1=max(X_1,...,X_n)|U_1=u_1)=u_1^{\alpha_1/\alpha_2+...+\alpha_1/\alpha_n}$
これを積分して
$P(X_1=max(X_1,...,X_n))=\int_0^1 P(X_1=max(X_1,...,X_n)|U_1=u_1)du_1=\frac{1/\alpha_1}{1/\alpha_1+...+1/\alpha_n}$
と求まります。