ベイズの定理
※「事前確率」「事後確率」について良く分からないという人は1つ下の見出しから読んで下さい。
$$ P(A|B) = \frac{P(B|A)P(A)}{P(B)} \tag{1} $$
「ベイズの定理」は上のように書かれることが多いが、下のように書くことで別の見方を強調できる。
$$ P(A|B) = \frac{P(B|A)}{P(B)}P(A) \tag{2} $$
(1)と(2)は同じ式の書き方を変えただけだが、(2)の方が事前確率P(A)がBの情報を得て、事後確率P(A|B)に更新される意味が強調される。
事後確率P(A|B)はBという情報を得た後の確率で、事前確率P(A)はBという情報を得る前の確率だ。
(1)(2)で表される「ベイズの定理」はBという情報を得た時、事前確率がどのように事後確率に更新されるかを表す定理だと考えることもできる。
(2)のような数式の書き方は数学書では一般的では無いかもしれないが、パターン認識などの応用分野ではしれっと出てきたりする。
事前確率 / 事後確率
例えば、数字5ケタが当選番号と一致したら100万円がもらえる宝くじを考えよう。
あなたはこの宝くじを1枚買った。このとき、何も情報が得られていない場合の当選確率、すなわち事前確率は1/100000だ。
しかし、あなたは買ったくじの番号を慎重に左から眺めていき、なんと最初の4ケタが当選番号と一致していることが分かった。最後の1ケタはまだ手で隠している。最後の1ケタが当選番号と同じなら100万円ゲットだ。
このとき、最初の4ケタが当選番号と一致しているという情報を得た後での当選確率は1/100000のままで全く期待できないものであるだろうか。
最後の1ケタが当選番号と一致していれば、当選なのだから当選確率、すなわち最初の4ケタが一致しているという情報を得た後での事後確率は1/10に更新されている。
このような更新を数式化したのがベイズの定理であり、事前確率、事後確率というのは情報を得る前か後の確率だと考えれば良い。
コメント