acpass

統計公式

ひとことで言うと

標準化は Z=(Xμ)/σZ=(X-\mu)/\sigma で、どんな量も『平均0・ばらつき1』のものさしに揃える操作です。これにより『平均から標準偏差何個ぶん離れているか』で異常度を測れます。注意したいのは、標本平均を標準化するときは分母が生の σ\sigma ではなく、その統計量自身の標準誤差 σ/n\sigma/\sqrt n になる点です。

上は母集団分布(μ=50,σ=10)で生の観測値x=65は平均から15ずれ標準化するとz=1.5。下はn=25の標本平均分布で標準誤差SE=σ/√25=2と幅が縮み、x̄=53は平均からわずか3ずれるだけだが分母がSEなのでやはりz=1.5。標本平均では分母が生のσでなくその統計量自身の標準誤差σ/√nになり、平均をとると散らばりが縮むことを示す分母が変わる:生はσ、標本平均はSE=σ/√n。どちらもz=1.5μ=50x=65 (+15=1.5σ)生の観測 σ=10 → z=1.5μ=50x̄=53 (+3=1.5SE)標本平均 SE=2 → z=1.5

上:母集団 N(μ=50,σ=10)N(\mu{=}50,\sigma{=}10) の生の観測値 x=65x=65 は平均から15ずれ z=1.5z=1.5。下:n=25n=25 の標本平均は SE=σ/25=2SE=\sigma/\sqrt{25}=2 と幅が縮み、xˉ=53\bar x=53 はわずか3ずれるだけで同じ z=1.5z=1.5。分母が σ\sigma から SESE に変わる。

数式で表すと

Z=XμσZ=\dfrac{X-\mu}{\sigma}

Z=(Xμ)/σZ=(X-\mu)/\sigma で平均0・分散1に変換。正規確率を標準正規表で読む基本操作。

標準化とは、確率変数 XX から Z=XμσZ=\dfrac{X-\mu}{\sigma} を作る操作で、平均を引いて標準偏差で割ることで E[Z]=0, Var(Z)=1E[Z]=0,\ \mathrm{Var}(Z)=1 の『標準的なものさし』に揃えます。正規分布では、これは N(μ,σ2)N(\mu,\sigma^2)N(0,1)N(0,1) に直して正規分布表を読むための操作として登場しました。ここではそれとは別の角度——標準化は正規分布に限らず使えるという一般性と、標本統計量を標準化するときの分母に焦点を当てます。 まず一般性です。平均と分散が有限なら、XX がどんな分布でも Z=(Xμ)/σZ=(X-\mu)/\sigma は必ず E[Z]=0, Var(Z)=1E[Z]=0,\ \mathrm{Var}(Z)=1 になります。これは平均・分散の線形変換の性質(E[aX+b]=aE[X]+bE[aX+b]=aE[X]+bVar(aX+b)=a2Var(X)\mathrm{Var}(aX+b)=a^2\mathrm{Var}(X))から出る代数的な事実で、分布の種類によりません。注意すべきは『ZZ が標準正規になる』のは元の XX が正規のときだけという点です。標準化は平均と散らばりを揃えるだけで、分布の形(歪みや裾の重さ)は変えません。だから指数分布を標準化しても右に歪んだままで、N(0,1)N(0,1) にはなりません。 次に、本概念で最も実務的に効くのが標本統計量の標準化です。生の観測値1個を標準化するときの分母は σ\sigma ですが、標本平均 Xˉ\bar X のような統計量を標準化するときは、分母をその統計量自身の標準偏差=標準誤差 σ/n\sigma/\sqrt n にしなければなりません:Z=(Xˉμ)/(σ/n)Z=(\bar X-\mu)/(\sigma/\sqrt n) です。生の XX の標準化の分母 σ\sigma とは別物で、n\sqrt n のぶんだけ分母が小さくなります。これは『平均をとると散らばりが縮む』ことの直接の反映です。具体的に、μ=50,σ=10\mu=50,\sigma=10 の母集団で、生の観測値 x=65x=65(平均から15ずれ)を標準化すると z=(6550)/10=1.5z=(65-50)/10=1.5。一方 n=25n=25 の標本平均 xˉ=53\bar x=53(平均からわずか3ずれ)を標準化すると、分母は SE=10/25=2SE=10/\sqrt{25}=2 なので z=(5350)/2=1.5z=(53-50)/2=1.5 と同じ z 値になります。生では15ずれて初めて『1.5個ぶん異常』なのに、標本平均では3ずれただけで同じ異常度——平均をとると散らばりが縮むため、小さなずれが相対的に大きな意味をもつのです。

試験に出る性質

定義と効果

Z=(Xμ)/σZ=(X-\mu)/\sigmaE[Z]=0, Var(Z)=1E[Z]=0,\ \mathrm{Var}(Z)=1 に揃える。『平均から標準偏差何個ぶん離れているか』で異常度を測れる。

分布によらない一般性

平均・分散が有限ならどんな分布でも E[Z]=0,Var(Z)=1E[Z]=0,\mathrm{Var}(Z)=1。代数的事実で分布の種類によらない。

形は変わらない

標準化は平均と散らばりを揃えるだけで歪みや裾の重さは保つ。ZZ が標準正規になるのは元 XX が正規のときに限る。

標本統計量の分母は標準誤差

標本平均の標準化は Z=(Xˉμ)/(σ/n)Z=(\bar X-\mu)/(\sigma/\sqrt n)。分母は生の σ\sigma でなく標準誤差 σ/n\sigma/\sqrt nn\sqrt n で縮む)。

検定・推定の基礎パターン

『統計量を標準誤差で割って標準化し、表で確率を読む』型は区間推定・仮説検定で繰り返し使われる汎用手順の土台。

例で見る

μ=50, σ=10\mu=50,\ \sigma=10 の母集団。生の観測値 x=65x=65 を標準化:z=(6550)/10=1.5z=(65-50)/10=1.5n=25n=25 の標本平均 xˉ=53\bar x=53 を標準化:分母は SE=σ/25=10/5=2SE=\sigma/\sqrt{25}=10/5=2 なので z=(5350)/2=1.5z=(53-50)/2=1.5。 生が15ずれた場合と標本平均がわずか3ずれた場合が、標準化後は同じ z=1.5z=1.5(=平均をとると散らばりが縮む実感)。

つまずきポイント

  • 標準化すれば必ず正規分布表が使えると思う(標準化は形を変えない。ZZ が標準正規になるのは元が正規のときだけ。歪んだ分布は歪んだまま)
  • 標本平均の標準化でも分母に生の σ\sigma を使う(正しくは標準誤差 σ/n\sigma/\sqrt nn\sqrt n のぶん分母が小さくなる)
  • E[Z]=0,Var(Z)=1E[Z]=0,\mathrm{Var}(Z)=1 になるのを正規分布限定と思う(平均・分散が有限ならどんな分布でも成り立つ代数的事実)

定着クイズ

標準化 Z=(Xμ)/σZ=(X-\mu)/\sigma の結果として常に成り立つのは?

標本平均 Xˉ\bar X を標準化するときの分母は?

μ=50,σ=10\mu=50,\sigma=10n=25n=25 の標本平均 xˉ=53\bar x=53zz 値は?

この用語を扱う問題(1