acpass

正規近似

知識マップ

統計公式

ひとことで言うと

「二項分布やポアソン分布のような扱いにくい分布を、計算しやすい正規分布で“だいたい同じ”とみなして近似する」手法です。たくさん足し合わさった量は正規分布に近づく(中心極限定理)、という事実が根拠です。

二項分布B(20,0.4)の棒グラフに、平均np・分散np(1-p)の正規曲線を重ねた図。離散の山が連続曲線でよく近似できる二項分布の棒を正規曲線 N(np, np(1−p)) で近似0246810121416k(成功回数)確率

二項分布 B(20,0.4)B(20,0.4) の棒グラフに、平均 npnp・分散 np(1p)np(1-p) の正規分布の曲線を重ねたもの。離散の山が連続曲線でよく近似できているのが分かる。

数式で表すと

B(n,p)N(np,np(1p))B(n,p)\approx N(np,np(1-p))

二項・ポアソンなどを正規分布で近似する手法。CLTが根拠。

正規近似は、扱いにくい分布を平均と分散を合わせた正規分布で置き換える手法です。代表例が二項分布で、nn が大きいとき B(n,p)N(np, np(1p))B(n,p)\approx N\big(np,\ np(1-p)\big) と近似できます。根拠は中心極限定理です。二項分布は独立なベルヌーイ試行 nn 個の和なので、nn が大きくなると和の分布が正規分布に近づくのです(目安として npnpn(1p)n(1-p) がともに5以上あれば近似が良いとされます)。 離散分布(二項・ポアソンなど)を連続分布(正規)で近似するときは、連続性補正を入れると精度が上がります。例えば二項分布で P(Xk)P(X\le k) を近似するときは、棒グラフの幅を考えて境界を半分ぶん外側にずらし P(Xk)Φ ⁣(k+0.5npnp(1p))P(X\le k)\approx\Phi\!\left(\dfrac{k+0.5-np}{\sqrt{np(1-p)}}\right) とします(Φ\Phi は標準正規の累積分布関数)。+0.5+0.5 が連続性補正で、これを入れないと離散の棒1本ぶんの確率を取りこぼし、近似が系統的にずれます。P(Xk)P(X\ge k) なら k0.5k-0.5P(X=k)P(X=k) なら k0.5k-0.5k+0.5k+0.5 ではさむ、というように向きに応じて補正します。 ポアソン分布も同様に、平均 λ\lambda が大きいとき Po(λ)N(λ,λ)\mathrm{Po}(\lambda)\approx N(\lambda,\lambda) と正規近似できます(ポアソンは平均=分散なので、両方を λ\lambda に合わせます)。なお二項分布側から見ると、nn が大きく pp が小さい(npnp が中程度)ときは正規近似よりもポアソン近似 B(n,p)Po(np)B(n,p)\approx\mathrm{Po}(np) の方が適し、λ=np\lambda=np がさらに大きくなるとそのポアソンを正規で近似する、という二段構えの関係になっています。

試験に出る性質

二項の正規近似

nn が大きいとき B(n,p)N(np,np(1p))B(n,p)\approx N(np,np(1-p))。平均と分散を合わせる。根拠はCLT。

近似が良い目安

np5np\ge5 かつ n(1p)5n(1-p)\ge5 程度。pp が0や1に極端だと近似は悪くなる。

連続性補正

離散を連続で近似するため境界を ±0.5\pm0.5 ずらす:P(Xk)Φ((k+0.5np)/np(1p))P(X\le k)\approx\Phi\big((k+0.5-np)/\sqrt{np(1-p)}\big)

ポアソンの正規近似

λ\lambda が大きいとき Po(λ)N(λ,λ)\mathrm{Po}(\lambda)\approx N(\lambda,\lambda)。平均=分散を λ\lambda に合わせる。

近似の使い分け

nn 大・pp 小(npnp 中程度)はポアソン近似、npnp も大きければ正規近似、という二段構え。

例で見る

B(20,0.4)B(20,0.4)(平均 np=8np=8、分散 np(1p)=4.8np(1-p)=4.8、標準偏差 2.19\approx2.19)で P(X10)P(X\le10) を連続性補正つき正規近似する: P(X10)Φ ⁣(10+0.582.19)=Φ(1.14)0.873P(X\le10)\approx\Phi\!\left(\dfrac{10+0.5-8}{2.19}\right)=\Phi(1.14)\approx0.873。 補正なし(1010 で計算)だと Φ(0.91)0.819\Phi(0.91)\approx0.819 となり、真の値からずれやすい。

つまずきポイント

  • 連続性補正を忘れる(離散→連続の近似では境界を ±0.5\pm0.5 ずらさないと系統的にずれる)
  • 分散に npnp を使う(二項の分散は np(1p)np(1-p)。平均が npnp、分散が np(1p)np(1-p) で別物)
  • pp が0や1に極端/nn が小さい場面で正規近似を使う(近似が悪い。npnp 小ならポアソン近似が適切)

定着クイズ

二項分布 B(n,p)B(n,p) の正規近似はどの正規分布?

離散分布を正規で近似するときに精度を上げる補正は?

ポアソン分布 Po(λ)\mathrm{Po}(\lambda) の正規近似(λ\lambda 大)はどの正規分布?

この用語を扱う問題(2

正規近似とは|定義・公式とアクチュアリー試験の関連問題 | acpass