標準化

統計・公式

ひとことで言うと

標準化は $Z=(X-\mu)/\sigma$ で、どんな量も『平均0・ばらつき1』のものさしに揃える操作です。これにより『平均から標準偏差何個ぶん離れているか』で異常度を測れます。注意したいのは、標本平均を標準化するときは分母が生の $\sigma$ ではなく、その統計量自身の標準誤差 $\sigma/\sqrt n$ になる点です。

上：母集団 $N(\mu{=}50,\sigma{=}10)$ の生の観測値 $x=65$ は平均から15ずれ $z=1.5$ 。下： $n=25$ の標本平均は $SE=\sigma/\sqrt{25}=2$ と幅が縮み、 $\bar x=53$ はわずか3ずれるだけで同じ $z=1.5$ 。分母が $\sigma$ から $SE$ に変わる。

数式で表すと

$Z=\dfrac{X-\mu}{\sigma}$

$Z=(X-\mu)/\sigma$ で平均0・分散1に変換。正規確率を標準正規表で読む基本操作。

標準化とは、確率変数

X

から

Z=\dfrac{X-\mu}{\sigma}

を作る操作で、平均を引いて標準偏差で割ることで

E[Z]=0,\ \mathrm{Var}(Z)=1

の『標準的なものさし』に揃えます。正規分布では、これは

N(\mu,\sigma^2)

を

N(0,1)

に直して正規分布表を読むための操作として登場しました。ここではそれとは別の角度——標準化は正規分布に限らず使えるという一般性と、標本統計量を標準化するときの分母に焦点を当てます。まず一般性です。平均と分散が有限なら、

X

がどんな分布でも

Z=(X-\mu)/\sigma

は必ず

E[Z]=0,\ \mathrm{Var}(Z)=1

になります。これは平均・分散の線形変換の性質（

E[aX+b]=aE[X]+b

、

\mathrm{Var}(aX+b)=a^2\mathrm{Var}(X)

）から出る代数的な事実で、分布の種類によりません。注意すべきは『

Z

が標準正規になる』のは元の

X

が正規のときだけという点です。標準化は平均と散らばりを揃えるだけで、分布の形（歪みや裾の重さ）は変えません。だから指数分布を標準化しても右に歪んだままで、

N(0,1)

にはなりません。次に、本概念で最も実務的に効くのが標本統計量の標準化です。生の観測値1個を標準化するときの分母は

\sigma

ですが、標本平均

\bar X

のような統計量を標準化するときは、分母をその統計量自身の標準偏差＝標準誤差

\sigma/\sqrt n

にしなければなりません：

Z=(\bar X-\mu)/(\sigma/\sqrt n)

です。生の

X

の標準化の分母

\sigma

とは別物で、

\sqrt n

のぶんだけ分母が小さくなります。これは『平均をとると散らばりが縮む』ことの直接の反映です。具体的に、

\mu=50,\sigma=10

の母集団で、生の観測値

x=65

（平均から15ずれ）を標準化すると

z=(65-50)/10=1.5

。一方

n=25

の標本平均

\bar x=53

（平均からわずか3ずれ）を標準化すると、分母は

SE=10/\sqrt{25}=2

なので

z=(53-50)/2=1.5

と同じ z 値になります。生では15ずれて初めて『1.5個ぶん異常』なのに、標本平均では3ずれただけで同じ異常度——平均をとると散らばりが縮むため、小さなずれが相対的に大きな意味をもつのです。

試験に出る性質

定義と効果

$Z=(X-\mu)/\sigma$ 。 $E[Z]=0,\ \mathrm{Var}(Z)=1$ に揃える。『平均から標準偏差何個ぶん離れているか』で異常度を測れる。

分布によらない一般性

平均・分散が有限ならどんな分布でも $E[Z]=0,\mathrm{Var}(Z)=1$ 。代数的事実で分布の種類によらない。

形は変わらない

標準化は平均と散らばりを揃えるだけで歪みや裾の重さは保つ。 $Z$ が標準正規になるのは元 $X$ が正規のときに限る。

標本統計量の分母は標準誤差

標本平均の標準化は $Z=(\bar X-\mu)/(\sigma/\sqrt n)$ 。分母は生の $\sigma$ でなく標準誤差 $\sigma/\sqrt n$ （ $\sqrt n$ で縮む）。

検定・推定の基礎パターン

『統計量を標準誤差で割って標準化し、表で確率を読む』型は区間推定・仮説検定で繰り返し使われる汎用手順の土台。

例で見る

$\mu=50,\ \sigma=10$ の母集団。生の観測値 $x=65$ を標準化： $z=(65-50)/10=1.5$ 。 $n=25$ の標本平均 $\bar x=53$ を標準化：分母は $SE=\sigma/\sqrt{25}=10/5=2$ なので $z=(53-50)/2=1.5$ 。生が15ずれた場合と標本平均がわずか3ずれた場合が、標準化後は同じ $z=1.5$ （＝平均をとると散らばりが縮む実感）。

つまずきポイント

標準化すれば必ず正規分布表が使えると思う（標準化は形を変えない。 $Z$ が標準正規になるのは元が正規のときだけ。歪んだ分布は歪んだまま）
標本平均の標準化でも分母に生の $\sigma$ を使う（正しくは標準誤差 $\sigma/\sqrt n$ 。 $\sqrt n$ のぶん分母が小さくなる）
$E[Z]=0,\mathrm{Var}(Z)=1$ になるのを正規分布限定と思う（平均・分散が有限ならどんな分布でも成り立つ代数的事実）

定着クイズ

標準化 $Z=(X-\mu)/\sigma$ の結果として常に成り立つのは？

標本平均 $\bar X$ を標準化するときの分母は？

$\mu=50,\sigma=10$ で $n=25$ の標本平均 $\bar x=53$ の $z$ 値は？

関連：#正規分布 #パーセント点

この用語を扱う問題（1）

区間推定統計・★★