acpass

仮説検定

知識マップ

統計用語

ひとことで言うと

「帰無仮説H0が正しい」という前提のもとで、観測されたデータがどれくらい起こりにくいかを評価し、十分に起こりにくければH0を棄却する枠組みです。

こんなデータが従う

新薬の効果検定(対照群との比較)保険料率の変更が必要かの検定製品の不良率が基準を超えるかの検定2群の平均の差の検定(t検定)死亡率が想定と異なるかの検定

「差がある」と主張するための統計的な裏付けを与える枠組みです。実務では有意水準(α)をあらかじめ決めて運用します。

H0のもとでの検定統計量の分布。両端の棄却域(面積α/2ずつ)に統計量が入るとH0を棄却するH0のもとでの分布棄却域α/2棄却域α/2検定統計量

H0のもとでの検定統計量の分布。両端の棄却域(面積α/2ずつ)に統計量が入るとH0を棄却する。

数式で表すと

z>zα/2H0 棄却|z|>z_{\alpha/2}\Rightarrow H_0\ \text{棄却}

帰無仮説 H0H_0 を検定統計量と棄却域で評価する枠組み。標準誤差は H0H_0 の値で計算する。

仮説検定は、帰無仮説 H0H_0(通常「差がない」「変化がない」という保守的な仮説)を立て、観測データから計算した検定統計量がH0のもとでどれくらい起こりにくいかを評価する枠組みです。検定統計量が棄却域(あらかじめ決めた有意水準αに対応する極端な値の範囲)に入れば、H0を棄却します:z>zα/2H0 棄却|z|>z_{\alpha/2}\Rightarrow H_0\ \text{棄却}。 重要なのは、検定統計量の標準誤差はH0が正しいという前提のもとで計算することです(区間推定では推定値自体から標準誤差を計算しますが、仮説検定ではH0で仮定された値を使います)。両側検定では棄却域を両端に置き面積α/2ずつ、片側検定では片方に全てのαを置きます。 仮説検定の結論は「H0を棄却する」か「H0を棄却しない(棄却できない)」のいずれかであり、「H0が正しいと証明された」わけではないことに注意が必要です。データがH0と矛盾しないというだけで、対立仮説H1が正しいことを積極的に示すものではありません(concept: 検出力)。

試験に出る性質

帰無仮説H0

保守的な仮定(差がない・変化がない)。検定統計量はH0のもとで計算する。

棄却の基準

z>zα/2H0|z|>z_{\alpha/2}\Rightarrow H_0棄却(両側検定)。

有意水準α

第1種の誤り(H0が正しいのに棄却してしまう確率)の上限。

両側検定と片側検定

対立仮説の方向性により棄却域の置き方が変わる。

「棄却しない」≠「正しいと証明」

データがH0と矛盾しないことを示すに過ぎない。

例で見る

H0:μ=50に対し、標本平均X̄=54, SE=2のとき検定統計量 z=(5450)/2=2z=(54-50)/2=2z0.025=1.96z_{0.025}=1.96 より z>1.96|z|>1.96 なのでH0を棄却。

つまずきポイント

  • 標準誤差を計算する際に観測値(標本平均など)を使ってしまう(H0で仮定された値を使うのが正しい)
  • 「H0を棄却しない」を「H0が正しいと証明された」と解釈する
  • 両側検定と片側検定で棄却域の置き方(α/2ずつか、α全部か)を混同する

定着クイズ

H0:μ=100, X̄=106, SE=3のとき検定統計量zは?

仮説検定で標準誤差を計算する際に使う値は?

「H0を棄却しない」結果が意味するものは?

この用語を扱う問題(3