適合度検定

知識マップ

統計・用語

ひとことで言うと

観測されたデータの度数分布が、想定している理論分布（モデル）に合っているかどうかをチェックする検定です。観測度数と期待度数のズレの大きさをχ²統計量で測ります。

こんなデータが従う

死亡率データが想定した生命表に従っているかの検定サイコロが公正かどうかの検定保険金請求件数がポアソン分布に従っているかの検定アンケート回答の分布が想定した比率と一致するかの検定遺伝の法則（メンデルの比率）の検証

「このデータは想定したモデル（分布）から来ていると言えるか」を検証する代表的な手法です。カテゴリデータの分析で広く使われます。

観測度数（塗り）と理論度数（点線枠）をカテゴリごとに並べた棒グラフ。ズレが大きいほどχ²統計量が大きくなる。

数式で表すと

$\chi^2=\sum\dfrac{(O_i-E_i)^2}{E_i}$

観測度数が理論分布に合うかをカイ二乗で検定。自由度はカテゴリ数 $-1$ 。

適合度検定は、観測度数

O_i

が理論分布から期待される度数

E_i

にどれだけ近いかを評価する検定です。検定統計量は

\chi^2=\sum\dfrac{(O_i-E_i)^2}{E_i}

で、観測度数と期待度数のズレを二乗して期待度数で正規化し、全カテゴリにわたって足し合わせます。この統計量は、帰無仮説（データは想定した理論分布に従う）のもとで近似的に自由度

k-1

のχ²分布に従います（kはカテゴリ数。パラメータを標本から推定した場合はさらに自由度が減ります）。χ²統計量が大きい（臨界値を超える）ほど、観測度数が理論度数から大きくズレていることを意味し、H0を棄却します。適合度検定を使う際は、各カテゴリの期待度数Eiが小さすぎない（目安として5以上）ことが望ましいとされます。期待度数が小さいカテゴリが多いと、χ²近似の精度が落ちるため、カテゴリを統合するなどの工夫が必要です。

試験に出る性質

検定統計量

$\chi^2=\sum(O_i-E_i)^2/E_i$ 。

自由度

カテゴリ数 $k-1$ （パラメータを推定した場合はさらに減る）。

棄却の基準

χ²統計量が臨界値を超えるとH0（理論分布に従う）を棄却。

期待度数の目安

各カテゴリの $E_i$ が小さすぎない（目安5以上）ことが望ましい。

適用範囲

離散・連続どちらのデータもカテゴリに分けてあれば適用できる。

例で見る

観測度数[18,32,41,25,14]、期待度数[20,30,38,28,14]のとき、 $\chi^2=\frac{2^2}{20}+\frac{2^2}{30}+\frac{3^2}{38}+\frac{3^2}{28}+\frac{0^2}{14}\approx0.89$ 。自由度4のχ²分布の臨界値と比較してH0の棄却を判断する。

つまずきポイント

χ²統計量の分母を観測度数Oiにしてしまう（正しくは期待度数Eiで割る）
自由度をカテゴリ数kのまま使ってしまう（正しくはk-1、パラメータ推定があればさらに減る）
期待度数が極端に小さいカテゴリがあるまま検定を行い、近似精度の低下を無視する

定着クイズ

適合度検定のχ²統計量の式は？

カテゴリ数k=5のとき、適合度検定の自由度は？（パラメータ推定なし）

適合度検定で望ましいとされる期待度数の目安は？

関連：#χ²検定 #χ²分布 #多項分布

この用語を扱う問題（3）