acpass

χ²分布

知識マップ

確率用語

ひとことで言うと

「独立な標準正規分布をいくつか2乗して足し合わせた量」が従う分布です。2乗して足すので必ず0以上の値になり、標本分散や適合度検定(χ²検定)の土台として登場します。

こんなデータが従う

標本分散 $(n-1)S^2/\sigma^2$ の散らばり適合度検定(χ²検定)の統計量分割表の独立性検定の統計量正規データの分散に関する区間推定複数の標準正規の二乗和

「独立な標準正規 Z1,,ZkZ_1,\dots,Z_k を2乗して足した量 Zi2\sum Z_i^2」がχ²分布です。足す個数 kk を自由度と呼び、標本分散や適合度検定の基礎分布として現れます。

自由度k=2,4,8のχ²分布の密度を重ねた図。kが増えるほど山が右へ移り、左右対称(正規分布)に近づく自由度kが増えるほど山は右へ移り、左右対称に近づく0481216k=2k=4k=8x(≥0)f(x)

自由度 k=2,4,8k=2,4,8 のχ²分布の密度。すべて0以上の右に裾を引く分布で、kk が大きいほど山が右へ移り、左右対称(正規分布)に近づく。

数式で表すと

i=1kZi2χ2(k), E=k, Var=2k\sum_{i=1}^{k}Z_i^2\sim\chi^2(k),\ E=k,\ \mathrm{Var}=2k

独立な標準正規の二乗和の分布。標本分散・適合度検定の基礎分布。

χ²分布は、独立な標準正規分布 Z1,,ZkZ_1,\dots,Z_k を2乗して足した量 χ2(k)=Z12+Z22++Zk2\chi^2(k)=Z_1^2+Z_2^2+\dots+Z_k^2 が従う分布です。足し合わせる個数 kk を自由度と呼びます。2乗の和なので値は必ず0以上で、分布は左端が0に張りつき、右に裾を引く非対称な形をしています。 平均と分散は定義から導けます。標準正規 ZZ について E[Z2]=Var(Z)=1E[Z^2]=\mathrm{Var}(Z)=1、また E[Z4]=3E[Z^4]=3 から Var(Z2)=E[Z4](E[Z2])2=31=2\mathrm{Var}(Z^2)=E[Z^4]-(E[Z^2])^2=3-1=2。これを独立に kk 個足すので E[χ2(k)]=k,Var(χ2(k))=2kE[\chi^2(k)]=k,\quad \mathrm{Var}(\chi^2(k))=2k となります。自由度がそのまま平均、その2倍が分散です。kk が大きいほど(独立な量をたくさん足すので)中心極限定理が効き、χ²分布は正規分布に近づいて左右対称になっていきます。 χ²分布はガンマ分布の特別な場合でもあり、λ=1/2, kgamma=n/2\lambda=1/2,\ k_{\text{gamma}}=n/2 のガンマ分布がちょうど χ2(n)\chi^2(n) に一致します。実務での最大の出番は標本分散です。正規母集団からの標本では (n1)S2/σ2χ2(n1)(n-1)S^2/\sigma^2\sim\chi^2(n-1) が成り立ち、これが分散の区間推定や検定の根拠になります。また、観測度数と期待度数のズレを測る適合度検定(χ²検定)の統計量も、近似的にχ²分布に従います。

試験に出る性質

定義

独立な標準正規の二乗和 i=1kZi2χ2(k)\sum_{i=1}^k Z_i^2\sim\chi^2(k)kk を自由度と呼ぶ。

平均と分散

E=kE=kVar=2k\mathrm{Var}=2k。自由度がそのまま平均、その2倍が分散。

非負・右に裾

2乗和なので値は0以上。左端0に張りつき右へ裾を引く非対称分布。kk が大きいと正規に近づく。

標本分散との関係

正規母集団で (n1)S2/σ2χ2(n1)(n-1)S^2/\sigma^2\sim\chi^2(n-1)。分散の検定・区間推定の土台。

ガンマ分布の特別な場合

λ=1/2, kgamma=n/2\lambda=1/2,\ k_{\text{gamma}}=n/2 のガンマ分布が χ2(n)\chi^2(n) に一致する。

例で見る

標準正規 Z1,Z2,Z3Z_1,Z_2,Z_3(独立)について W=Z12+Z22+Z32W=Z_1^2+Z_2^2+Z_3^2χ2(3)\chi^2(3) に従う。その平均と分散は E[W]=k=3,Var(W)=2k=6E[W]=k=3,\quad \mathrm{Var}(W)=2k=6。 自由度3なので、平均3・分散6の右に裾を引く分布になる。

つまずきポイント

  • 負の値を取りうると考える(2乗和なのでχ²は必ず0以上)
  • 分散を自由度 kk そのものと取り違える(平均が kk、分散は 2k2k
  • 標本分散の自由度を nn とする(正規母集団では (n1)S2/σ2χ2(n1)(n-1)S^2/\sigma^2\sim\chi^2(n-1) で自由度は n1n-1

定着クイズ

χ²分布 χ2(k)\chi^2(k) はどう作られる?

χ2(k)\chi^2(k) の平均と分散は?

正規母集団の標本分散について成り立つのは?

この用語を扱う問題(6

χ²分布とは|定義・公式とアクチュアリー試験の関連問題 | acpass