acpass

確率定理

ひとことで言うと

「結果Dが起きる確率を、その原因をいくつかの排反なケースに場合分けして、各ケースごとの確率を足し合わせて求める」公式です。遠回りに見えて、直接求めにくい確率を計算する王道です。

標本空間を排反な原因H1,H2,H3で分割した帯。各原因の中でDが占める割合(濃い部分)を重みP(Hi)で足し合わせるとP(D)になる全事象を排反な原因H₁,H₂,H₃に分割(赤=D)H₁P(H₁)=0.45H₂P(H₂)=0.3H₃P(H₃)=0.25P(D)=ΣP(D|Hᵢ)P(Hᵢ)(各原因の赤い割合×原因の確率の合計)

標本空間を排反な原因 H1,H2,H3H_1,H_2,H_3 に分割した帯。各原因の中でDが占める割合(濃い部分)を、その原因の確率 P(Hi)P(H_i) で重みづけて足すと P(D)P(D) になる。

数式で表すと

P(D)=iP(DHi)P(Hi)P(D)=\sum_i P(D\mid H_i)P(H_i)

排反な原因で場合分けして周辺確率を求める公式。ベイズの分母。

全確率の公式は、標本空間を互いに排反で全体を覆い尽くす原因 H1,,HnH_1,\dots,H_n(分割)に分けたとき P(D)=iP(DHi)P(Hi)P(D)=\sum_i P(D\mid H_i)P(H_i)DD の確率を組み立てます。直感は「Dが起きるすべての経路を、原因ごとに分けて足し上げる」こと。各項 P(DHi)P(Hi)P(D\mid H_i)P(H_i) は乗法定理 P(DHi)P(D\cap H_i) そのもので、排反な DHiD\cap H_i を全部足せば P(D)P(D) になる、という当たり前の足し算です。 前提として、分割 {Hi}\{H_i\} は「漏れなく(全体を覆う)・重なりなく(互いに排反)」でなければなりません。ここが崩れると二重計上や数え落としが起き、確率の合計が1からズレます。 全確率の公式はベイズの定理の分母そのものです。ベイズで P(HiD)P(H_i\mid D) を求めるとき、分母 P(D)P(D) をこの公式で計算して正規化します。つまり全確率は「原因→結果」の順方向に確率を組み立てる式で、ベイズはそれを「結果→原因」に逆算する式、という表裏の関係にあります。

試験に出る性質

公式

P(D)=iP(DHi)P(Hi)P(D)=\sum_i P(D\mid H_i)P(H_i)。原因ごとの経路を足し合わせる。

分割の条件

{Hi}\{H_i\} は排反(重なりなし)かつ網羅的(合計で全体)でなければならない。

乗法定理が各項

各項 P(DHi)P(Hi)=P(DHi)P(D\mid H_i)P(H_i)=P(D\cap H_i)。排反な同時確率の和。

ベイズの分母

ベイズの定理 P(HiD)=P(DHi)P(Hi)/P(D)P(H_i\mid D)=P(D\mid H_i)P(H_i)/P(D) の分母 P(D)P(D) がこの公式。

2分割の基本形

P(D)=P(DH)P(H)+P(DHc)P(Hc)P(D)=P(D\mid H)P(H)+P(D\mid H^c)P(H^c)。原因がある/ないの2択が最頻出。

例で見る

2つの工場 H1H_1(生産40%・不良率2%)と H2H_2(生産60%・不良率5%)から製品が来る。製品が不良 DD である確率は P(D)=0.02×0.4+0.05×0.6=0.008+0.030=0.038P(D)=0.02\times0.4+0.05\times0.6=0.008+0.030=0.038。 全体の不良率は約3.8%。

つまずきポイント

  • 分割 HiH_i が排反・網羅になっていない(重複や抜けで合計が1からズレる)
  • P(DHi)P(D\mid H_i) に重み P(Hi)P(H_i) を掛け忘れ、条件付き確率を単純に足す
  • 全確率(順方向)とベイズ(逆方向)の役割を取り違える

定着クイズ

全確率の公式 P(D)=iP(DHi)P(Hi)P(D)=\sum_i P(D\mid H_i)P(H_i) で、分割 {Hi}\{H_i\} に必要な条件は?

工場H₁(確率0.4,不良率0.02)とH₂(確率0.6,不良率0.05)から来る製品の全体の不良率P(D)は?

全確率の公式はどの定理の分母として現れる?

この用語を扱う問題(1