acpass

統計用語

ひとことで言うと

対立仮説H1が真であるときに、正しくH0を棄却できる確率です。第2種の誤り(本当は差があるのに見逃してしまう確率β)の裏返しにあたります。

こんなデータが従う

臨床試験で必要な標本数の計算(検出力80%を確保するためのn)新製品の改善効果を検出できる確率の評価A/Bテストでサンプルサイズが十分かの判断品質管理での不良率の変化を検知する力

検定の「感度」を表す指標で、標本数や効果量(検出したい差の大きさ)の設計に使われます。

H0のもとでの分布とH1のもとでの分布が重なる図。棄却域に入る確率が、H0ならα、H1なら検出力1-βになる棄却点H0の分布H1の分布α検出力 1−β検定統計量

H0の分布(破線)とH1の分布(実線)が重なる図。棄却域に入る確率がH0ならα、H1なら検出力1-β。

数式で表すと

power=1β\text{power}=1-\beta

対立仮説が真のとき正しく棄却する確率 1β1-\beta。第2種の誤りの裏。

検出力(power)は、対立仮説H1が真であるときに、正しく帰無仮説H0を棄却できる確率です:power=1β\text{power}=1-\beta。βは第2種の誤り(H0が誤っているのに棄却できない確率)で、検出力はその裏返しにあたります。 検出力は、有意水準α、標本数n、効果量(H0とH1の母数の差の大きさ)、母分散の4つの要素に依存します。nを増やすか、効果量が大きいほど検出力は高くなります。実務では、検定を計画する段階で「検出力80%以上を確保するには標本数がいくつ必要か」を逆算することがよく行われます(検出力分析、power analysis)。 αと検出力にはトレードオフがあります。αを小さくする(第1種の誤りを減らす)と棄却域が狭くなり、検出力は下がります(第2種の誤りが増える)。両方を同時に改善するには標本数を増やすしかありません。

試験に出る性質

定義

power=1β\text{power}=1-\beta

第1種・第2種の誤りとの関係

αは第1種の誤りの確率、βは第2種の誤りの確率(検出力=1-β)。

検出力を左右する要素

標本数n、効果量、有意水準α、母分散。

αとのトレードオフ

αを小さくすると検出力は下がる(両方同時に改善するにはnを増やす)。

検出力分析

目標検出力(例80%)を満たす必要標本数を逆算する実務手法。

例で見る

効果量が大きいほど、また標本数nが大きいほど、H1の分布の山がH0の棄却点から離れ、検出力(1-β)は大きくなる。

つまずきポイント

  • 検出力とαを混同する(αはH0が正しいときに誤って棄却する確率、検出力はH1が正しいときに正しく棄却する確率)
  • 検出力を上げたいときにαを下げてしまう(実際は逆効果。nを増やすか効果量を見直す)
  • 「検出力が低い検定で差が見つからなかった」を「差がない証拠」と解釈する(検出力が低いと本当の差を見逃しやすいだけ)

定着クイズ

検出力の定義は?

有意水準αを下げると検出力はどうなる?

検出力を上げる方法として適切なものは?

この用語を扱う問題(4