acpass

統計用語

ひとことで言うと

「もし帰無仮説 H0H_0 が正しかったとして、いま観測したのと同じか、それ以上に極端なデータがたまたま出てしまう確率」がp値です。この確率が小さい(有意水準より小さい)ほど「H0H_0 では説明しにくい珍しいことが起きた」と考えて H0H_0 を棄却します。

標準正規曲線で、観測値z=±2.0より外側の斜線部がp値(両側)。臨界値z=±1.96を破線で重ねると、斜線部分がα領域よりわずかに小さく、p<αで帰無仮説を棄却することが視覚的に分かる図斜線部=p値(両側)。z=±1.96の破線より外なので p<α で棄却p/2z=2.01.96z

標準正規曲線で、観測値 z=±2.0z=\pm2.0 より外側の斜線部がp値(両側)。臨界値 z=±1.96z=\pm1.96 を破線で重ねると、斜線部分(p値)が破線の外側にあり α\alpha 領域よりわずかに小さい。つまり p<αp<\alpha なので H0H_0 を棄却する。

数式で表すと

p<αH0 棄却p<\alpha\Rightarrow H_0\ \text{棄却}

H0H_0 の下で観測値以上に極端な値が出る確率。有意水準と比較して判断する。

p値(p-value)は、帰無仮説 H0H_0 が正しいと仮定したうえで、「いま手元で観測した検定統計量と同じか、それ以上に極端な値」が出る確率です。記号で書くと、観測した統計量を zobsz_{\mathrm{obs}} として、両側検定なら p=P(ZzobsH0)p=P\big(|Z|\ge |z_{\mathrm{obs}}|\mid H_0\big) です(ZZH0H_0 のもとでの検定統計量、|\cdot| は絶対値)。concept: 仮説検定では「統計量が臨界値 zα/2z_{\alpha/2} を超えたら棄却」という棄却域の言葉で判定しましたが、p値はそれを「確率」の言葉で言い換えたものです。両者は完全に同じ判定を与え、その対応関係が p<α  H0 を棄却p<\alpha\ \Longleftrightarrow\ H_0\ \text{を棄却} です。α\alpha は有意水準(あらかじめ決めた棄却の基準、たとえば0.05)です。 なぜこの2つが一致するのかを、concept: 仮説検定で扱ったのと同じ例で確かめます。H0:μ=50H_0:\mu=50、標本平均 Xˉ=54\bar X=54、標準誤差 SE=2\mathrm{SE}=2 のとき、検定統計量は zobs=(5450)/2=2.0z_{\mathrm{obs}}=(54-50)/2=2.0 でした。臨界値 z0.025=1.96z_{0.025}=1.96 と比べて zobs=2.0>1.96|z_{\mathrm{obs}}|=2.0>1.96 だから棄却、というのが棄却域による判定です。これをp値で見ると、両側なので p=2×P(Z2.0)=2×(1Φ(2.0))=2×0.0228=0.0456p=2\times P(Z\ge 2.0)=2\times(1-\Phi(2.0))=2\times0.0228=0.0456 です(Φ\Phi は標準正規の累積分布関数)。p=0.0456<0.05=αp=0.0456<0.05=\alpha なので、やはり棄却。まったく同じ状況を、臨界値で見るか確率で見るかの違いにすぎません。図では、z=±2.0z=\pm2.0 の外側(p値)が z=±1.96z=\pm1.96 の外側(α\alpha)よりわずかに内側に食い込んでいる=面積が小さいことが、p<αp<\alpha を表しています。 p値の便利な点は、「棄却したか否か」だけでなく「どれくらいぎりぎりだったか/どれくらい強く棄却されたか」という証拠の強さが数値で分かることです。p=0.04p=0.04p=0.0001p=0.0001 はどちらも α=0.05\alpha=0.05 で棄却ですが、後者の方がはるかに H0H_0 では起こりにくい結果です。なお注意として、片側検定か両側検定かでp値は2倍違います。上の例の片側版なら p=P(Z2.0)=0.0228p=P(Z\ge2.0)=0.0228 で、両側の半分です。どちらの対立仮説を立てているかで分母(極端さの数え方)が変わるため、問題設定を必ず確認してください。

試験に出る性質

定義

H0H_0 のもとで観測値以上に極端な値が出る確率。p=P(ZzobsH0)p=P(|Z|\ge|z_{\mathrm{obs}}|\mid H_0)(両側)。

棄却基準との同値

p<α  H0p<\alpha\ \Leftrightarrow\ H_0 棄却。棄却域による判定(concept: 仮説検定)と完全に一致する。

両側は2倍

両側検定では p=2×P(Zzobs)p=2\times P(Z\ge|z_{\mathrm{obs}}|)。片側はその半分。設定で2倍違う。

証拠の強さ

p値が小さいほど H0H_0 のもとで起こりにくく、棄却の証拠が強い。0/1判定より情報量が多い。

例の一貫性

zobs=2.0z_{\mathrm{obs}}=2.0(両側)なら p=2(1Φ(2.0))=0.0456<0.05p=2(1-\Phi(2.0))=0.0456<0.05 で棄却。concept: 仮説検定のz=2.0の例と同じ判定。

例で見る

concept: 仮説検定と同じ設定で、H0:μ=50H_0:\mu=50Xˉ=54\bar X=54SE=2\mathrm{SE}=2zobs=2.0z_{\mathrm{obs}}=2.0。両側p値は p=2×(1Φ(2.0))=2×0.0228=0.0456p=2\times(1-\Phi(2.0))=2\times0.0228=0.0456p=0.0456<0.05=αp=0.0456<0.05=\alpha なので H0H_0 を棄却。臨界値 1.961.96 による判定とまったく同じ結論になる。

つまずきポイント

  • p値を「H0H_0 が正しい確率」と誤解する(正しくは「H0H_0 のもとでこのデータ以上に極端な値が出る確率」。H0H_0 の真偽の確率ではない)
  • 片側と両側でp値が2倍違うのを忘れる(両側は片側の2倍。立てた対立仮説に合わせて数える)
  • p>0.05p>0.05 だから H0H_0 が正しいと証明された」と解釈する(棄却できなかっただけで、H0H_0 の正しさの証明にはならない)

定着クイズ

p値の正しい定義は?

zobs=2.0z_{\mathrm{obs}}=2.0(両側)のときのp値は?(1Φ(2.0)=0.02281-\Phi(2.0)=0.0228

p>0.05p>0.05 だった」ことの正しい解釈は?

この用語を扱う問題(1

p値とは|定義・公式とアクチュアリー試験の関連問題 | acpass