χ²検定
知識マップ統計・用語
ひとことで言うと
カイ二乗統計量 を使う検定の総称です。「適合度検定」と「独立性検定」が代表で、どちらも観測度数 と期待度数 のズレを測ります。ここでは特に分割表(クロス集計)を使う独立性検定を主役に扱います。
2×2分割表の各セルに観測度数 と期待度数 を書き込んだ図。期待度数は で求め、 のズレを で集計する。自由度は 。
数式で表すと
カイ二乗統計量による検定の総称(適合度・独立性)。期待度数との乖離を測る。
試験に出る性質
共通の統計量
。観測と期待のズレを二乗して で正規化し足し上げる。
2つの検定の総称
適合度検定(理論分布への当てはまり)と独立性検定(2変数の独立性)をまとめてχ²検定と呼ぶ。
適合度検定の自由度
カテゴリ数 で自由度 (推定パラメータ分さらに減る)。詳細は concept: 適合度検定。
独立性検定の期待度数
。独立なら同時確率は周辺確率の積、という事実から。
独立性検定の自由度
( 行・ 列)。2×2表なら1。適合度の とは別の公式。
例で見る
2×2分割表で観測度数が (総合計100、行合計40・60、列合計50・50)。左上の期待度数は 。同様に各セルの を出して を計算する。 自由度は で、自由度1のχ²分布の臨界値と比較する。
つまずきポイント
- 独立性検定の自由度に適合度の を使う(独立性検定は 。表の行数・列数から決める)
- 期待度数 の計算で「行合計×列合計÷総合計」を取り違える(総合計で割るのを忘れない)
- の分母を観測度数 にする(割るのは期待度数 )
定着クイズ
χ²検定の統計量 で割る分母は?
行 列の分割表による独立性検定の自由度は?
独立性検定での期待度数 の求め方は?