blueblog

宇宙一統計ができない農学系M1の勉強用ブログ

PRML悪戦苦闘(演習問題 2.7)

2.7

問題文(適当に要約)

 \muの事前分布がベータ分布
 Beta(\mu|a,b)=\frac{\Gamma(a+b)}{\Gamma(a)\Gamma(b)} \mu^{a-1} (1-\mu)^{b-1}
である二項分布
 \sum_{m=0}^N \begin{pmatrix}N\\m\end{pmatrix} \mu^m(1-\mu)^{N-m}
にしたがう確率変数 xを考える。

ここで x=1事象 m回、 x=0事象 l回生じたとする。このとき \muの事後平均が事前平均と \mu最尤推定量の間の値になることを示せ。

方針

事前分布の平均は、ベータ分布の超パラメータ a,bを用いて
{ \displaystyle
\frac{a}{a+b}
}
と表せます。
二項分布を尤度関数として、事前分布にベータ分布を選択すると、事後分布もまたベータ分布となることをPRMLの本編2.1.1で学びました。
これは共役性と呼ばれる重要な性質で、事後分布の超パラメータは a a+mに、 b b+lに置き換えたものになります。

従って事後平均は、
{ \displaystyle
p(x=1|D)=\frac{a+m}{a+m+b+l}
}
と表せます。

また、データからの最尤推定量は単に観察値に基づいた確率を求めればよく、 m+l回の試行の中で x=1事象が起こる確率
{ \displaystyle
\frac{m}{m+l}
}
となります。

事後平均が事前平均と最尤推定量の間の値になることは、 0\leq \lambda\leq 1として
{ \displaystyle
\frac{a+m}{a+m+b+l}=\lambda \frac{a}{a+b}+(1-\lambda) \frac{m}{m+l}
}
を示せば良いですね(ここまではもとの問題文に書いてあります)。

解答

{ \displaystyle
\begin{eqnarray*}
\lambda \frac{a}{a+b}+(1-\lambda) \frac{m}{m+l}&=& \frac{a\lambda}{a+b}+ \frac{m(1-\lambda)}{m+l}\\
&=&\frac{a\lambda(m+l)+m(1-\lambda)(a+b)}{(a+b)(m+l)}\\
&=&\frac{al\lambda + m(a+b-b\lambda)}{(a+b)(m+l)}\\
&=&\frac{(al-bm)\lambda + m(a+b)}{(a+b)(m+l)}
\end{eqnarray*}
}

したがって、
{ \displaystyle
\begin{eqnarray*}
\frac{m+a}{a+b+m+l}&=&\frac{(al-bm)\lambda + m(a+b)}{(a+b)(m+l)}\\
\end{eqnarray*}
}

これを \lambdaに関して式変形して
{ \displaystyle
\begin{eqnarray*}
(al-bm)\lambda&=&\{\frac{m+a}{a+b+m+l}-\frac{m}{m+l}\}*(m+l)(a+b)\\
&=&\frac{al-bm}{(a+b+m+l)(m+l)}(m+l)(a+b)\\
\end{eqnarray*}
}

したがって、
{ \displaystyle
\begin{eqnarray*}
\lambda=\frac{m+a}{a+b+m+l}\\
\end{eqnarray*}
}

a,b,m,lはいずれも非負なので 0\leq \frac{m+a}{a+b+m+l}\leq 1が示せます。

また、観察値m,lが大きくなると事後平均が最尤推定値に近づいていくことも理解できます。