acpass

ポアソン近似

知識マップ

確率公式

ひとことで言うと

「試行回数 nn がとても多いのに、1回あたりの成功確率 pp がとても小さい」二項分布は、平均 λ=np\lambda=np を1つ決めるだけのポアソン分布でうまく近似できます。階乗や巨大なべき乗の計算を避けられるので、レアな事故・請求の件数を扱うときの定番の道具です。

二項分布B(100,0.03)の真の確率を塗り棒、ポアソン分布Pois(3)による近似を破線枠で重ねた棒グラフ。np=3と中程度で、n大p小のためほぼ完全に重なり、ポアソン近似がよく当てはまることが分かる塗り=真値 B(100,0.03) 破線=近似 Pois(3) np=3でほぼ一致01234567確率件数 k

二項分布 B(100,0.03)B(100,0.03) の真の確率(塗り棒)と、ポアソン分布 Pois(3)\mathrm{Pois}(3) による近似(破線枠)を重ねた図。np=3np=3 と中程度で、nn 大・pp 小のため両者はほぼ完全に重なる。

数式で表すと

B(n,p)Pois(np)B(n,p)\approx\mathrm{Pois}(np)

nn 大・pp 小の二項分布をポアソンで近似する。λ=np\lambda=np

ポアソン近似は、nn が大きく pp が小さい二項分布 B(n,p)B(n,p) を、平均 λ=np\lambda=np のポアソン分布で置き換える近似です。 B(n,p)Pois(np)B(n,p)\approx\mathrm{Pois}(np) なぜ成り立つかは、n, p0, np=λn\to\infty,\ p\to0,\ np=\lambda 一定の極限を考えると見えます。二項の確率質量関数 (nk)pk(1p)nk\binom{n}{k}p^k(1-p)^{n-k} にこの極限を入れると eλλk/k!e^{-\lambda}\lambda^k/k!、すなわちポアソンの確率質量関数に収束します。直感的には、長さ1の時間を nn 個の極小区間に分け、各区間で確率 p=λ/np=\lambda/n の事故が高々1回起こる、と考えると、区間数 nn を無限に細かくした極限がポアソン過程=ポアソン分布になる、というイメージです。 実務での要点は正規近似との使い分けです。第一に、nn が大きく pp が小さくて npnp が中程度(おおむね10以下)にとどまる「レアイベント型」なら、ポアソン近似が良く効きます。第二に、npnpn(1p)n(1-p) もともに大きい(両方5以上が目安)「成功も失敗も十分起こる型」なら、正規近似(連続性補正つき)が適します。ポアソン近似の目安はおおむね n20n\ge20 かつ p0.05p\le0.05 程度とされます。 数値で精度を確かめます。B(100,0.03)B(100,0.03)np=3np=3)で、P(X=0)P(X=0) は真値 (0.97)1000.04755(0.97)^{100}\approx0.04755、ポアソン近似は e30.04979e^{-3}\approx0.04979(相対誤差約4.7%)。P(X=1)P(X=1) は真値 0.14706\approx0.14706、近似は 3e30.149363e^{-3}\approx0.14936(相対誤差約1.5%)。npnp が小さく pp が小さいほど近似は良くなります。

試験に出る性質

近似の主張

nn 大・pp 小なら B(n,p)Pois(λ)B(n,p)\approx\mathrm{Pois}(\lambda)λ=np\lambda=np。平均1つで近似できる。

極限としての正当化

n,p0,np=λn\to\infty,p\to0,np=\lambda 一定で二項のpmfが eλλk/k!e^{-\lambda}\lambda^k/k! に収束する。

正規近似との使い分け

npnp が中程度(10以下)でレアならポアソン、npnpn(1p)n(1-p) がともに大(5以上)なら正規近似。

適用の目安

おおむね n20n\ge20 かつ p0.05p\le0.05npnp が小さく pp が小さいほど近似精度が上がる。

誤差の実例

B(100,0.03)B(100,0.03)P(X=0)P(X=0) は真値0.04755 vs 近似0.04979(誤差4.7%)、P(X=1)P(X=1) は0.14706 vs 0.14936(誤差1.5%)。

例で見る

B(100,0.03)B(100,0.03)np=3np=3)で2通りの確率を真値とポアソン近似 Pois(3)\mathrm{Pois}(3) で比較する。 P(X=0)P(X=0):真値 (0.97)1000.04755(0.97)^{100}\approx0.04755、近似 e30.04979e^{-3}\approx0.04979(相対誤差約4.7%)。 P(X=1)P(X=1):真値 0.14706\approx0.14706、近似 3e30.149363e^{-3}\approx0.14936(相対誤差約1.5%)。 np=3np=3 と中程度、p=0.030.05p=0.03\le0.05 なのでポアソン近似がよく当てはまる。

つまずきポイント

  • pp が小さくないのにポアソン近似を使う(pp が中庸なら正規近似の領域)
  • ポアソン近似(二項→ポアソン、nnpp小)と超幾何→二項の収束を混同する(条件も向きも別物)
  • λ\lambdanpnp 以外で設定する(近似ポアソンの平均は必ず λ=np\lambda=np

定着クイズ

ポアソン近似 B(n,p)Pois(λ)B(n,p)\approx\mathrm{Pois}(\lambda)λ\lambda は?

ポアソン近似と正規近似の使い分けで正しいのは?

B(100,0.03)B(100,0.03)P(X=0)P(X=0) をポアソン近似 e3e^{-3} で求めるとおよそ?

この用語を扱う問題(2