PRML悪戦苦闘(演習問題 2.1)
夏休みの自主課題としてPRMLの演習問題を解いています。間違いがあったらご指摘下さい。
いきなり2章からスタートします。数式の練習も兼ねてやや過剰に詳しく書きます。
2.1
問題文
(1)~(3)
ベルヌーイ分布
が次の性質を満たすことを確かめよ
(1)正規化
(2)期待値
(3)分散
(1)正規化
ベルヌーイ分布において確率変数は2値をとります。(例:コインの裏表。なら裏、なら表)
ここでとなる確率をとします。
今考えているのは二値確率なので、となる確率はこの余事象 で表せます。
したがって、
と示せます。
(2)期待値
離散確率分布の期待値の定義から、
となります。
あとは実現値をとして、上式の確率のところにベルヌーイ分布の式を代入すれば良いです。
と示せます。
(3)分散
分散の定義から、
となります。(この式の導出は演習1.5で扱いました。そのうちまとめます)
したがって、
と示せます。
(4)エントロピー
エントロピー(平均情報量)の式は
で与えられます。どうしてこうなるのかは演習1.28で示しました。(そのうち……まとめます)
この式に素直に代入すると、
と示せます。
エントロピーは、分布の持つ情報量の大きさを表す尺度ですが、個人的には「分布を用いた予測の難しさを表す尺度」と言い換えた方がしっくりきました。
例えば表裏が均等に出るフェアなコイン(エントロピーが最大)と、表が99%の確率で出るイカサマコイン(情報エントロピーが小さい)を比べると、次に出る目の予測は前者の方がずっと難しいです。後者はとりあえず表と言っておけばほぼ的中します。
(4)式を用いて具体的に計算すると、
フェアなコインのエントロピーはを代入して0.693
イカサマコインのエントロピーはを代入して0.0560 となります
また、前者は一様分布であり後者は極端に尖った分布ですから、平らな分布ほどエントロピーが大きいということも直感的に理解できます。
このあたりのことは
情報って何だろう?
がとても参考になりました。