ベイズ
知識マップ確率・定理
ひとことで言うと
結果(データD)が観測された後で、その原因(仮説H)の確率を、検査前の予想(事前確率)から検査後の確率(事後確率)へ更新する手続きです。
こんなデータが従う
検査結果が陽性のときに実際に病気である確率迷惑メール判定でその単語を含むときに迷惑メールである確率契約者が事故を起こしたときにハイリスク層である確率品質検査で不良が出たときにどの工程が原因かの推定スパムフィルタや診断システムの判定確率の更新
「結果は観測できるが原因は直接観測できない」状況全般で使われます。事前確率(base rate)を無視すると、検査が高精度に見えても実際の事後確率は大きく異なることがあります(検査のパラドックス)。
事前確率P(H)から出発し、尤度P(D|H)を経て観測データDに到達する木構造。ベイズの定理は、この木をDから逆算してP(H|D)を求める操作。
数式で表すと
試験に出る性質
事後 ∝ 事前×尤度
。分母(全確率)は正規化定数で、比だけ見ればこの関係で十分なことが多い。
分母は全確率
。すべての仮説からDが起きる確率の合計。
逐次更新
事後確率を次の事前確率として、新しいデータが来るたびに繰り返し更新できる。
base rate fallacy
事前確率(基礎率)が低いと、検査が高精度でも事後確率は大きく下がる。事前確率を無視するのが典型的な誤り。
2仮説の比の形
(オッズの更新として書ける)。
例で見る
ある病気の罹患率は事前確率 。検査の感度は 、偽陽性率は とする。 陽性と分かったときに実際に病気である確率は 検査が95%の精度でも、事前確率が低いため事後確率は約16%にとどまる。
つまずきポイント
- 事前確率(base rate)を無視して、尤度だけで判断してしまう
- (尤度)と (事後確率)を取り違える
- 分母の全確率 の計算で、想定する仮説 を網羅し忘れる
定着クイズ
ベイズの定理の分母 が表すものは?
ある病気の事前確率(罹患率)が非常に低いとき、検査が高精度でも陽性者の中で実際に病気である割合(事後確率)はどうなりやすい?
と の関係について正しいのは?
この用語を扱う問題(4)