多腕バンディット問題入門に引き続き,報酬が平均・分散が未知の正規分布に従うと仮定したThompson Samplingの解説第2回目です.
第2回目となる今回は,ベイズ推定について解説を行います.
TL;DR
- ベイズ推定では,ある事象に対する事後分布を求める
- 平均・分散が未知の正規分布のパラメータをベイズ推定する手順を解説
- 事後分布の導出を簡単にするために,事前分布を平均と分散それぞれの事前分布に分離
- 平均に対する事前分布は正規分布,分散に対する事前分布はscaled inverse chi-squared分布をチョイス
- これによって事前分布が共役事前分布になるので,平均,分散に対する事後分布も正規分布とscaled inverse chi-aquared分布になる
ベイズ推定とは
データをサンプルする未知の分布をベイズ推定するとは,その分布のパラメータの事後分布を求めることにほかなりません.
今回は,データが平均・分散が未知の正規分布によってサンプルされていると仮定してベイズ推定を行います.
したがって,今回は平均と分散の事後分布を求めることになります.
さて,事後分布はベイズの定理
を用いることによって導出します. ここで,はに関する尤度関数,は事前分布を表しています.
実は,上の式を用いることで,尤度関数と事前分布が明示的に与えられていれば,事後分布を導出することができます.
以降では,その導出方法について解説を行います.
事前分布の導出
事前分布の分離
事前分布を見ると,この分布は2つの確率変数の組に関する分布になっていることが分かります.
これではこの後の式導出で扱いにくいので,以下のように,それぞれのパラメータに対する事前分布に分けて考えるようにします.
上の式によって,事前分布を平均に対する事前分布と分散に対する事前分布に分離することができました.
事前分布を平均,それぞれに対する事前分布に分離することができましたので,次は,それぞれに対する事前分布を適当な分布として与えましょう.
平均に対する事前分布
平均に対する事前分布は,正規分布であるとします. ここで,は事前分布のパラメータとします.
この仮定によって,平均に対する事前分布の確率密度関数は以下のようになります.
分散に対する事前分布
分散に対する事前分布は,scaled inverse chi-squared分布であるとします. ここで,は事前分布のパラメータとします.
この仮定によって,分散に対する事前分布の確率密度関数は以下のようになります.
事前分布
平均,分散それぞれに対する事前分布の確率密度関数を与えることができたので,晴れて事前分布の確率密度関数を求めることができます.
事前分布の確率密度関数は,これまでの式を用いると,以下のように導出されます.
さらに,この式を少し整理をすると,
が成り立つことを導くことができます.
尤度関数の導出
この記事の始めに,データは平均・分散が未知の正規分布に従ってサンプルされると仮定しました.
よって,尤度関数は,正規分布の確率密度関数の積によって与えられます.
つまり,尤度関数は,
で与えられます.
事後分布の導出
さて,ようやく事前分布と尤度関数の式を決めることができたので,ここからは事後分布の導出を行いましょう.
これまでの式を用いると,
と式変形をすることができます.
式を見やすくするために,
と定義すると,事後分布は,
と書き直されます.
この式を事前分布の確率密度関数の式と見比べると,事前分布と事後分布の関数形が一致していることが分かります. このことから,事前分布は共役事前分布であることが分かります.
さらに,事後分布の確率密度関数の式から,
であることが導かれます.
この式と,事前分布が共役事前分布であることを考えると,平均に対する事後分布および分散に対する事後分布は,以下のように導きだされます.