確率・用語
ひとことで言うと
「独立な標準正規分布をいくつか2乗して足し合わせた量」が従う分布です。2乗して足すので必ず0以上の値になり、標本分散や適合度検定(χ²検定)の土台として登場します。
こんなデータが従う
標本分散 $(n-1)S^2/\sigma^2$ の散らばり適合度検定(χ²検定)の統計量分割表の独立性検定の統計量正規データの分散に関する区間推定複数の標準正規の二乗和
「独立な標準正規 Z1,…,Zk を2乗して足した量 ∑Zi2」がχ²分布です。足す個数 k を自由度と呼び、標本分散や適合度検定の基礎分布として現れます。
自由度 k=2,4,8 のχ²分布の密度。すべて0以上の右に裾を引く分布で、k が大きいほど山が右へ移り、左右対称(正規分布)に近づく。
数式で表すと
∑i=1kZi2∼χ2(k), E=k, Var=2k
独立な標準正規の二乗和の分布。標本分散・適合度検定の基礎分布。
χ²分布は、独立な標準正規分布 Z1,…,Zk を2乗して足した量
χ2(k)=Z12+Z22+⋯+Zk2
が従う分布です。足し合わせる個数 k を自由度と呼びます。2乗の和なので値は必ず0以上で、分布は左端が0に張りつき、右に裾を引く非対称な形をしています。
平均と分散は定義から導けます。標準正規 Z について E[Z2]=Var(Z)=1、また E[Z4]=3 から Var(Z2)=E[Z4]−(E[Z2])2=3−1=2。これを独立に k 個足すので
E[χ2(k)]=k,Var(χ2(k))=2k
となります。自由度がそのまま平均、その2倍が分散です。k が大きいほど(独立な量をたくさん足すので)中心極限定理が効き、χ²分布は正規分布に近づいて左右対称になっていきます。
χ²分布はガンマ分布の特別な場合でもあり、λ=1/2, kgamma=n/2 のガンマ分布がちょうど χ2(n) に一致します。実務での最大の出番は標本分散です。正規母集団からの標本では (n−1)S2/σ2∼χ2(n−1) が成り立ち、これが分散の区間推定や検定の根拠になります。また、観測度数と期待度数のズレを測る適合度検定(χ²検定)の統計量も、近似的にχ²分布に従います。試験に出る性質
定義
独立な標準正規の二乗和 ∑i=1kZi2∼χ2(k)。k を自由度と呼ぶ。
平均と分散
E=k、Var=2k。自由度がそのまま平均、その2倍が分散。
非負・右に裾
2乗和なので値は0以上。左端0に張りつき右へ裾を引く非対称分布。k が大きいと正規に近づく。
標本分散との関係
正規母集団で (n−1)S2/σ2∼χ2(n−1)。分散の検定・区間推定の土台。
ガンマ分布の特別な場合
λ=1/2, kgamma=n/2 のガンマ分布が χ2(n) に一致する。
例で見る
標準正規 Z1,Z2,Z3(独立)について W=Z12+Z22+Z32 は χ2(3) に従う。その平均と分散は
E[W]=k=3,Var(W)=2k=6。
自由度3なので、平均3・分散6の右に裾を引く分布になる。
つまずきポイント
- 負の値を取りうると考える(2乗和なのでχ²は必ず0以上)
- 分散を自由度 k そのものと取り違える(平均が k、分散は 2k)
- 標本分散の自由度を n とする(正規母集団では (n−1)S2/σ2∼χ2(n−1) で自由度は n−1)
定着クイズ
χ²分布 χ2(k) はどう作られる?
χ2(k) の平均と分散は?
正規母集団の標本分散について成り立つのは?