acpass

第2種の過誤

知識マップ

統計用語

ひとことで言うと

「対立仮説が本当は正しいのに、帰無仮説を棄却しそびれてしまう」見逃しの誤りです。その確率を β\beta と書き、検出力は 1β1-\beta。第1種の過誤 α\alpha(無実なのに棄却する誤り)とはトレードオフの関係にあります。

帰無仮説H0(中心0)と対立仮説H1(中心5)の標本平均の分布を重ね、棄却点cで分けた図。H0曲線のc右側の面積が第1種の過誤α、H1曲線のc左側の面積が第2種の過誤β。βはH1の具体的な値のもとで計算し、検出力は1−β棄却点cで分割:H0側右の面積がα、H1側左の面積がβH₀:μ=0H₁:μ=5c=3.29βα

帰無仮説 H0H_0(中心0)と対立仮説 H1H_1(中心5)の標本平均の分布を重ね、棄却点 cc で分けた図。H0H_0 曲線の cc より右の面積が第1種の過誤 α\alphaH1H_1 曲線の cc より左の面積が第2種の過誤 β\betaβ\betaH1H_1 の具体的な値のもとで計算し、検出力は 1β1-\beta

数式で表すと

β=P(採択H1), power=1β\beta=P(\text{採択}\mid H_1),\ \text{power}=1-\beta

対立仮説が真なのに帰無仮説を棄却しない誤り。その確率を β\beta とし、検出力は 1β1-\beta。第1種の過誤 α\alpha とはトレードオフの関係。

第2種の過誤とは、対立仮説 H1H_1 が真であるのに帰無仮説 H0H_0 を棄却しない(見逃す)誤りで、その確率を β\beta と書きます。concept: 検出力で見たとおり検出力は 1β1-\beta と定義されますが、そこでは β\beta は概念として登場するにとどまりました。ここでは具体的に β\beta を計算するところまで踏み込みます。まず2つの誤りを表で整理しておきます。検定の結論(棄却する/しない)と真実(H0H_0 が真/H1H_1 が真)の組み合わせは4通りで、H0H_0 が真なのに棄却するのが第1種の過誤(確率 α\alpha)、H1H_1 が真なのに棄却しないのが第2種の過誤(確率 β\beta)です。α\alphaH0H_0 のもとで、β\betaH1H_1 のもとで測る、という測る土俵の違いが核心です。 計算例を、次の concept: 検定設計と完全に同じ数値で進めます。H0:μ=0H_0:\mu=0H1:μ=5H_1:\mu=5(対立側を具体的に μ=5\mu=5 と置く)、母標準偏差 σ=20\sigma=20、標本サイズ n=100n=100 とすると、標本平均の標準誤差は SE=σ/n=20/10=2\mathrm{SE}=\sigma/\sqrt n=20/10=2 です。有意水準 α=0.05\alpha=0.05 の片側検定(z0.05=1.645z_{0.05}=1.645)では、棄却点は c=0+1.645×2=3.29c=0+1.645\times2=3.29 です(Xˉ>3.29\bar X>3.29 で棄却)。第2種の過誤 β\beta は「H1H_1 が真(μ=5\mu=5)なのに棄却しない=Xˉ<c\bar X<c になる」確率なので、H1H_1 のもとで XˉN(5,22)\bar X\sim N(5,2^2) として β=P(Xˉ<3.29μ=5)=Φ ⁣(3.2952)=Φ(0.855)0.196\beta=P(\bar X<3.29\mid\mu=5)=\Phi\!\Big(\dfrac{3.29-5}{2}\Big)=\Phi(-0.855)\approx0.196 と求まります(Φ\Phi は標準正規の累積分布関数)。したがって検出力は 1β10.196=0.8041-\beta\approx1-0.196=0.804、つまり約80%です。図では、H1H_1 曲線の cc より左の塗りつぶしが β\betaH0H_0 曲線の cc より右が α\alpha に対応します。 この計算から β\beta の性質が見えてきます。第一に、β\betaH1H_1 のどの値を仮定するかで変わります。上では μ=5\mu=5 を仮定して β0.196\beta\approx0.196 でしたが、もし真の差がもっと小さい(μ\mu が0に近い)なら2つの分布が大きく重なり β\beta は大きく(見逃しやすく)なります。α\alpha が検定の設計で固定される一方、β\beta は対立仮説の値ごとに違う、という非対称性が重要です。第二に、α\alphaβ\beta はトレードオフします。棄却点 cc を右にずらして α\alpha を小さくすると、H1H_1 曲線の左側にかかる面積 β\beta は増えてしまいます。両方を同時に小さくするには標本サイズ nn を増やして2分布の重なり自体を減らすしかなく、これが concept: 検定設計の出発点になります。

試験に出る性質

定義

H1H_1 が真なのに H0H_0 を棄却しない誤り。確率 β=P(採択H1)\beta=P(\text{採択}\mid H_1)、検出力は 1β1-\beta

2種の過誤の表

H0H_0 真で棄却=第1種(α\alpha)、H1H_1 真で棄却せず=第2種(β\beta)。α\alphaH0H_0 側、β\betaH1H_1 側で測る。

$\beta$ の計算

棄却点 cc を求め、H1H_1 の分布のもとで Xˉ<c\bar X<c となる確率を計算する。例では β=Φ(0.855)0.196\beta=\Phi(-0.855)\approx0.196

$\beta$ は対立値依存

α\alpha は固定だが β\betaH1H_1 のどの値を仮定するかで変わる。真の差が小さいほど β\beta は大きい。

$\alpha$ とのトレードオフ

cc を動かすと α\alpha\downarrowβ\beta\uparrow。両方下げるには nn を増やすしかない(concept: 検定設計)。

例で見る

H0:μ=0H_0:\mu=0H1:μ=5H_1:\mu=5σ=20\sigma=20n=100n=100SE=2\mathrm{SE}=2)、片側 α=0.05\alpha=0.05z=1.645z=1.645)。棄却点は c=1.645×2=3.29c=1.645\times2=3.29β=P(Xˉ<3.29μ=5)=Φ ⁣((3.295)/2)=Φ(0.855)0.196\beta=P(\bar X<3.29\mid\mu=5)=\Phi\!\big((3.29-5)/2\big)=\Phi(-0.855)\approx0.196。 よって検出力 1β0.8041-\beta\approx0.804(約80%)。

つまずきポイント

  • β\betaH0H_0 のもとで計算してしまう(β\betaH1H_1 の具体的な値のもとで Xˉ<c\bar X<c となる確率。土俵は H1H_1 側)
  • β\beta を検定固有の1つの値だと思い込む(α\alpha は固定だが β\beta は対立仮説のどの値を仮定するかで変わる)
  • 「第1種の過誤の方が常に重大」と一般化する(どちらが重いかは文脈依存。見逃しが致命的な場面もある)

定着クイズ

第2種の過誤 β\beta はどの仮説のもとで計算するか?

H0:μ=0H_0:\mu=0H1:μ=5H_1:\mu=5σ=20\sigma=20n=100n=100、片側 α=0.05\alpha=0.05(棄却点 c=3.29c=3.29)のときの β\beta は?(Φ(0.855)0.196\Phi(-0.855)\approx0.196

α\alphaβ\beta の関係として正しいのは?

この用語を扱う問題(1

第2種の過誤とは|定義・公式とアクチュアリー試験の関連問題 | acpass