acpass

確率用語

ひとことで言うと

「データが平均からどれくらい散らばっているか」を表す代表的な指標です。平均からのズレを2乗して平均したもので、値が大きいほどバラバラ、小さいほど平均の近くに集まっています。

平均が同じでも分散が異なる2つの分布。分散が小さいと中心に集まり背が高く、大きいと横に広がる平均は同じでも、分散が大きいほど横に広がる共通の平均 μ分散小:中心に集まる分散大:散らばるx

同じ平均 μ をもつ2つの分布。分散が小さい方(実線)は中心に集まって背が高く、分散が大きい方(点線)は横に広がって低い。分散は“広がり”の度合い。

数式で表すと

Var(X)=E[X2](E[X])2\mathrm{Var}(X)=E[X^2]-(E[X])^2

期待値まわりのばらつき Var(X)=E[X2](E[X])2\mathrm{Var}(X)=E[X^2]-(E[X])^2。標準偏差はその平方根。

分散の定義は「平均からのズレ XμX-\mu を2乗した量の期待値」です:Var(X)=E[(Xμ)2]\mathrm{Var}(X)=E[(X-\mu)^2]。これを展開すると実用的な計算式 Var(X)=E[X2](E[X])2\mathrm{Var}(X)=E[X^2]-(E[X])^2 が得られます。「2乗の平均」から「平均の2乗」を引く、と覚えると計算が速くなります。ズレを2乗するのは、正のズレと負のズレが打ち消し合わないようにするためです。 分散は2乗した量なので単位も元の2乗になります(金額なら「円の2乗」)。これを元の単位に戻したのが標準偏差 σ=Var(X)\sigma=\sqrt{\mathrm{Var}(X)} で、散らばりを元のスケールで語りたいときに使います。 実務で頻出なのが線形変換と和の分散です。定数倍 aX+baX+b では Var(aX+b)=a2Var(X)\mathrm{Var}(aX+b)=a^2\mathrm{Var}(X)(定数 bb は散らばりに無関係、係数 aa は2乗で効く)。和では一般に Var(X+Y)=Var(X)+Var(Y)+2Cov(X,Y)\mathrm{Var}(X+Y)=\mathrm{Var}(X)+\mathrm{Var}(Y)+2\mathrm{Cov}(X,Y) となり、独立なら共分散の項が消えて単純な足し算になります。

試験に出る性質

計算式

Var(X)=E[X2](E[X])2\mathrm{Var}(X)=E[X^2]-(E[X])^2。「2乗の平均」−「平均の2乗」。

非負性

Var(X)0\mathrm{Var}(X)\ge 0。0になるのは XX が定数(散らばりゼロ)のときだけ。

線形変換

Var(aX+b)=a2Var(X)\mathrm{Var}(aX+b)=a^2\mathrm{Var}(X)。定数 bb は影響せず、係数は2乗で効く。

和の分散

Var(X+Y)=Var(X)+Var(Y)+2Cov(X,Y)\mathrm{Var}(X+Y)=\mathrm{Var}(X)+\mathrm{Var}(Y)+2\mathrm{Cov}(X,Y)。独立なら共分散の項が消える。

標準偏差との関係

σ=Var(X)\sigma=\sqrt{\mathrm{Var}(X)}。元の単位に戻した散らばりの指標。

例で見る

サイコロ1個の目 XX の分散を求める。E[X]=3.5E[X]=3.5E[X2]=(1+4+9+16+25+36)/6=91/615.17E[X^2]=(1+4+9+16+25+36)/6=91/6\approx15.17 なので Var(X)=15.173.52=15.1712.252.92\mathrm{Var}(X)=15.17-3.5^2=15.17-12.25\approx2.92。 標準偏差は 2.921.71\sqrt{2.92}\approx1.71

つまずきポイント

  • E[X2]E[X^2](E[X])2(E[X])^2 を取り違える(順序が逆だと負になってしまう)
  • 定数倍の分散で aa をそのまま掛ける(正しくは a2a^2 倍)
  • 和の分散で独立を確認せず共分散の項 2Cov2\mathrm{Cov} を落とす

定着クイズ

E[X]=2, E[X2]=9E[X]=2,\ E[X^2]=9 のとき Var(X)\mathrm{Var}(X) は?

Var(X)=4\mathrm{Var}(X)=4 のとき Var(3X+5)\mathrm{Var}(3X+5) は?

独立でない X,YX,Y について Var(X+Y)\mathrm{Var}(X+Y) の正しい式は?

この用語を扱う問題(2