ポアソン近似

確率・公式

ひとことで言うと

「試行回数 $n$ がとても多いのに、1回あたりの成功確率 $p$ がとても小さい」二項分布は、平均 $\lambda=np$ を1つ決めるだけのポアソン分布でうまく近似できます。階乗や巨大なべき乗の計算を避けられるので、レアな事故・請求の件数を扱うときの定番の道具です。

二項分布 $B(100,0.03)$ の真の確率（塗り棒）と、ポアソン分布 $\mathrm{Pois}(3)$ による近似（破線枠）を重ねた図。 $np=3$ と中程度で、 $n$ 大・ $p$ 小のため両者はほぼ完全に重なる。

数式で表すと

$B(n,p)\approx\mathrm{Pois}(np)$

$n$ 大・ $p$ 小の二項分布をポアソンで近似する。 $\lambda=np$ 。

ポアソン近似は、

n

が大きく

p

が小さい二項分布

B(n,p)

を、平均

\lambda=np

のポアソン分布で置き換える近似です。

B(n,p)\approx\mathrm{Pois}(np)

なぜ成り立つかは、

n\to\infty,\ p\to0,\ np=\lambda

一定の極限を考えると見えます。二項の確率質量関数

\binom{n}{k}p^k(1-p)^{n-k}

にこの極限を入れると

e^{-\lambda}\lambda^k/k!

、すなわちポアソンの確率質量関数に収束します。直感的には、長さ1の時間を

n

個の極小区間に分け、各区間で確率

p=\lambda/n

の事故が高々1回起こる、と考えると、区間数

n

を無限に細かくした極限がポアソン過程＝ポアソン分布になる、というイメージです。実務での要点は正規近似との使い分けです。第一に、

n

が大きく

p

が小さくて

np

が中程度（おおむね10以下）にとどまる「レアイベント型」なら、ポアソン近似が良く効きます。第二に、

np

も

n(1-p)

もともに大きい（両方5以上が目安）「成功も失敗も十分起こる型」なら、正規近似（連続性補正つき）が適します。ポアソン近似の目安はおおむね

n\ge20

かつ

p\le0.05

程度とされます。数値で精度を確かめます。

B(100,0.03)

（

np=3

）で、

P(X=0)

は真値

(0.97)^{100}\approx0.04755

、ポアソン近似は

e^{-3}\approx0.04979

（相対誤差約4.7%）。

P(X=1)

は真値

\approx0.14706

、近似は

3e^{-3}\approx0.14936

（相対誤差約1.5%）。

np

が小さく

p

が小さいほど近似は良くなります。

試験に出る性質

近似の主張

$n$ 大・ $p$ 小なら $B(n,p)\approx\mathrm{Pois}(\lambda)$ 、 $\lambda=np$ 。平均1つで近似できる。

極限としての正当化

$n\to\infty,p\to0,np=\lambda$ 一定で二項のpmfが $e^{-\lambda}\lambda^k/k!$ に収束する。

正規近似との使い分け

$np$ が中程度（10以下）でレアならポアソン、 $np$ と $n(1-p)$ がともに大（5以上）なら正規近似。

適用の目安

おおむね $n\ge20$ かつ $p\le0.05$ 。 $np$ が小さく $p$ が小さいほど近似精度が上がる。

誤差の実例

$B(100,0.03)$ で $P(X=0)$ は真値0.04755 vs 近似0.04979（誤差4.7%）、 $P(X=1)$ は0.14706 vs 0.14936（誤差1.5%）。

例で見る

$B(100,0.03)$ （ $np=3$ ）で2通りの確率を真値とポアソン近似 $\mathrm{Pois}(3)$ で比較する。 $P(X=0)$ ：真値 $(0.97)^{100}\approx0.04755$ 、近似 $e^{-3}\approx0.04979$ （相対誤差約4.7%）。 $P(X=1)$ ：真値 $\approx0.14706$ 、近似 $3e^{-3}\approx0.14936$ （相対誤差約1.5%）。 $np=3$ と中程度、 $p=0.03\le0.05$ なのでポアソン近似がよく当てはまる。

つまずきポイント

$p$ が小さくないのにポアソン近似を使う（ $p$ が中庸なら正規近似の領域）
ポアソン近似（二項→ポアソン、 $n$ 大 $p$ 小）と超幾何→二項の収束を混同する（条件も向きも別物）
$\lambda$ を $np$ 以外で設定する（近似ポアソンの平均は必ず $\lambda=np$ ）

定着クイズ

ポアソン近似 $B(n,p)\approx\mathrm{Pois}(\lambda)$ の $\lambda$ は？

ポアソン近似と正規近似の使い分けで正しいのは？

$B(100,0.03)$ で $P(X=0)$ をポアソン近似 $e^{-3}$ で求めるとおよそ？

関連：#二項分布 #ポアソン #正規近似

この用語を扱う問題（2）