acpass

正規分布

知識マップ

確率用語

ひとことで言うと

「平均値の周りにデータが最も多く集まり、平均から離れるほど少なくなる、左右対称の山型の分布」のことです。身長やテストの点数など、自然界や社会で最もよく見られるデータの散らばり方です。

こんなデータが従う

身長・体重テストの点数・偏差値測定誤差製品寸法のばらつき多数の小さな要因の合計

「たくさんの独立した小さな要因が足し合わさって決まる量」は、自然と正規分布に近づきます(=中心極限定理)。これが正規分布が至るところに現れる理由です。

平均μ・分散σ²の正規分布の確率密度関数約68% (μ±σ)f(x)変曲点xμ−2σμ−σμμ+σμ+2σ

この曲線は平均 μ・分散 σ² の正規分布の確率密度関数(PDF)f(x)f(x)。横軸は XX の値、縦軸は密度(高さは確率ではなく、面積が確率)。全面積は1、頂点が μ、変曲点が μ±σ。

数式で表すと

f(x)=12πσexp ⁣((xμ)22σ2)f(x)=\dfrac{1}{\sqrt{2\pi}\,\sigma}\exp\!\big(-\tfrac{(x-\mu)^2}{2\sigma^2}\big)

平均 μ\mu・分散 σ2\sigma^2 で定まり、標準化 Z=(Xμ)/σZ=(X-\mu)/\sigma で標準正規 N(0,1)N(0,1) に帰着する。

N(μ,σ2)N(\mu, \sigma^2) と書いて「平均 μ・分散 σ² の正規分布に従う」と読みます。N は Normal の頭文字で、第1引数が平均(中心)、第2引数が分散 σ²(標準偏差 σ の2乗)。N(0,1)N(0,1) は標準正規分布です。第2引数は分散であって標準偏差ではない点に注意。 では P(X60)P(X\le 60) のような確率はどう求めるか。これは曲線の下の面積(積分)ですが手計算は大変なので、正規分布表(付表)から読み取ります。ただし μ と σ の組合せは無限にあり、すべてに表は用意できません。 そこで、どの正規分布も共通のものさしに揃えるのが標準化です。Z=(Xμ)/σZ=(X-\mu)/\sigma とすると ZN(0,1)Z\sim N(0,1) になり、表1枚であらゆる確率が読めます。ZZ は「平均から標準偏差いくつ分離れているか」を表します。身近な例では偏差値がこれで、テストの点を平均50・標準偏差10に標準化したものです。

試験に出る性質

再生性(和の分布)

独立な XN(μ1,σ12)X\sim N(\mu_1,\sigma_1^2), YN(μ2,σ22)Y\sim N(\mu_2,\sigma_2^2) なら X+YN(μ1+μ2, σ12+σ22)X+Y\sim N(\mu_1+\mu_2,\ \sigma_1^2+\sigma_2^2)。和をとっても正規のまま。

差も正規(分散は足す)

XYN(μ1μ2, σ12+σ22)X-Y\sim N(\mu_1-\mu_2,\ \sigma_1^2+\sigma_2^2)。平均は引くが分散は足す(頻出のワナ)。

線形変換

XN(μ,σ2)X\sim N(\mu,\sigma^2) なら aX+bN(aμ+b, a2σ2)aX+b\sim N(a\mu+b,\ a^2\sigma^2)。定数倍は分散に a2a^2 がかかる。

対称性

標準正規は0対称。P(Zz)=P(Zz)=1Φ(z)P(Z\le -z)=P(Z\ge z)=1-\Phi(z)

正規近似(CLT)

独立な多数の和は正規に近づく。二項・ポアソンの正規近似の根拠。

68–95–99.7則

μ±σ に約68%、μ±2σ に約95%、μ±3σ に約99.7%。

例で見る

① 標準化:XN(50,102)X\sim N(50,10^2) のとき P(X60)P(X\le 60) は、Z=(6050)/10=1Z=(60-50)/10=1、表より P(Z1)=0.8413P(Z\le 1)=0.8413。 ② 再生性:独立に XN(2,32)X\sim N(2,3^2), YN(1,42)Y\sim N(1,4^2) のとき X+YN(3, 9+16)=N(3,25)=N(3,52)X+Y\sim N(3,\ 9+16)=N(3,25)=N(3,5^2)

つまずきポイント

  • 分散 σ² と標準偏差 σ の取り違え(標準化で割るのは σ、NN の第2引数は σ²)
  • XYX-Y の分散を引いてしまう。独立なら分散は必ず足す
  • 密度 f(x)f(x) の値を確率と勘違いする。確率は面積
  • 付表が上側・下側どちら向きの表か確認せず使う

定着クイズ

XN(20,52)X\sim N(20,5^2) のとき、X=30X=30 を標準化した ZZ は?

σ を2倍にすると、釣鐘型の山は?

独立に XN(2,32)X\sim N(2,3^2), YN(1,42)Y\sim N(1,4^2) のとき X+YX+Y は?

この用語を扱う問題(7