p値
知識マップ統計・用語
ひとことで言うと
「もし帰無仮説 が正しかったとして、いま観測したのと同じか、それ以上に極端なデータがたまたま出てしまう確率」がp値です。この確率が小さい(有意水準より小さい)ほど「 では説明しにくい珍しいことが起きた」と考えて を棄却します。
標準正規曲線で、観測値 より外側の斜線部がp値(両側)。臨界値 を破線で重ねると、斜線部分(p値)が破線の外側にあり 領域よりわずかに小さい。つまり なので を棄却する。
数式で表すと
の下で観測値以上に極端な値が出る確率。有意水準と比較して判断する。
試験に出る性質
定義
のもとで観測値以上に極端な値が出る確率。(両側)。
棄却基準との同値
棄却。棄却域による判定(concept: 仮説検定)と完全に一致する。
両側は2倍
両側検定では 。片側はその半分。設定で2倍違う。
証拠の強さ
p値が小さいほど のもとで起こりにくく、棄却の証拠が強い。0/1判定より情報量が多い。
例の一貫性
(両側)なら で棄却。concept: 仮説検定のz=2.0の例と同じ判定。
例で見る
concept: 仮説検定と同じ設定で、、、 → 。両側p値は 。 なので を棄却。臨界値 による判定とまったく同じ結論になる。
つまずきポイント
- p値を「 が正しい確率」と誤解する(正しくは「 のもとでこのデータ以上に極端な値が出る確率」。 の真偽の確率ではない)
- 片側と両側でp値が2倍違うのを忘れる(両側は片側の2倍。立てた対立仮説に合わせて数える)
- 「 だから が正しいと証明された」と解釈する(棄却できなかっただけで、 の正しさの証明にはならない)
定着クイズ
p値の正しい定義は?
(両側)のときのp値は?()
「 だった」ことの正しい解釈は?
この用語を扱う問題(1)