第2種の過誤

統計・用語

ひとことで言うと

「対立仮説が本当は正しいのに、帰無仮説を棄却しそびれてしまう」見逃しの誤りです。その確率を $\beta$ と書き、検出力は $1-\beta$ 。第1種の過誤 $\alpha$ （無実なのに棄却する誤り）とはトレードオフの関係にあります。

帰無仮説 $H_0$ （中心0）と対立仮説 $H_1$ （中心5）の標本平均の分布を重ね、棄却点 $c$ で分けた図。 $H_0$ 曲線の $c$ より右の面積が第1種の過誤 $\alpha$ 、 $H_1$ 曲線の $c$ より左の面積が第2種の過誤 $\beta$ 。 $\beta$ は $H_1$ の具体的な値のもとで計算し、検出力は $1-\beta$ 。

数式で表すと

$\beta=P(\text{採択}\mid H_1),\ \text{power}=1-\beta$

対立仮説が真なのに帰無仮説を棄却しない誤り。その確率を $\beta$ とし、検出力は $1-\beta$ 。第1種の過誤 $\alpha$ とはトレードオフの関係。

第2種の過誤とは、対立仮説

H_1

が真であるのに帰無仮説

H_0

を棄却しない（見逃す）誤りで、その確率を

\beta

と書きます。concept: 検出力で見たとおり検出力は

1-\beta

と定義されますが、そこでは

\beta

は概念として登場するにとどまりました。ここでは具体的に

\beta

を計算するところまで踏み込みます。まず2つの誤りを表で整理しておきます。検定の結論（棄却する／しない）と真実（

H_0

が真／

H_1

が真）の組み合わせは4通りで、

H_0

が真なのに棄却するのが第1種の過誤（確率

\alpha

）、

H_1

が真なのに棄却しないのが第2種の過誤（確率

\beta

）です。

\alpha

は

H_0

のもとで、

\beta

は

H_1

のもとで測る、という測る土俵の違いが核心です。計算例を、次の concept: 検定設計と完全に同じ数値で進めます。

H_0:\mu=0

対

H_1:\mu=5

（対立側を具体的に

\mu=5

と置く）、母標準偏差

\sigma=20

、標本サイズ

n=100

とすると、標本平均の標準誤差は

\mathrm{SE}=\sigma/\sqrt n=20/10=2

です。有意水準

\alpha=0.05

の片側検定（

z_{0.05}=1.645

）では、棄却点は

c=0+1.645\times2=3.29

です（

\bar X>3.29

で棄却）。第2種の過誤

\beta

は「

H_1

が真（

\mu=5

）なのに棄却しない＝

\bar X<c

になる」確率なので、

H_1

のもとで

\bar X\sim N(5,2^2)

として

\beta=P(\bar X<3.29\mid\mu=5)=\Phi\!\Big(\dfrac{3.29-5}{2}\Big)=\Phi(-0.855)\approx0.196

と求まります（

\Phi

は標準正規の累積分布関数）。したがって検出力は

1-\beta\approx1-0.196=0.804

、つまり約80%です。図では、

H_1

曲線の

c

より左の塗りつぶしが

\beta

、

H_0

曲線の

c

より右が

\alpha

に対応します。この計算から

\beta

の性質が見えてきます。第一に、

\beta

は

H_1

のどの値を仮定するかで変わります。上では

\mu=5

を仮定して

\beta\approx0.196

でしたが、もし真の差がもっと小さい（

\mu

が0に近い）なら2つの分布が大きく重なり

\beta

は大きく（見逃しやすく）なります。

\alpha

が検定の設計で固定される一方、

\beta

は対立仮説の値ごとに違う、という非対称性が重要です。第二に、

\alpha

と

\beta

はトレードオフします。棄却点

c

を右にずらして

\alpha

を小さくすると、

H_1

曲線の左側にかかる面積

\beta

は増えてしまいます。両方を同時に小さくするには標本サイズ

n

を増やして2分布の重なり自体を減らすしかなく、これが concept: 検定設計の出発点になります。

試験に出る性質

定義

$H_1$ が真なのに $H_0$ を棄却しない誤り。確率 $\beta=P(\text{採択}\mid H_1)$ 、検出力は $1-\beta$ 。

2種の過誤の表

$H_0$ 真で棄却＝第1種（ $\alpha$ ）、 $H_1$ 真で棄却せず＝第2種（ $\beta$ ）。 $\alpha$ は $H_0$ 側、 $\beta$ は $H_1$ 側で測る。

$\beta$ の計算

棄却点 $c$ を求め、 $H_1$ の分布のもとで $\bar X<c$ となる確率を計算する。例では $\beta=\Phi(-0.855)\approx0.196$ 。

$\beta$ は対立値依存

$\alpha$ は固定だが $\beta$ は $H_1$ のどの値を仮定するかで変わる。真の差が小さいほど $\beta$ は大きい。

$\alpha$ とのトレードオフ

$c$ を動かすと $\alpha\downarrow$ で $\beta\uparrow$ 。両方下げるには $n$ を増やすしかない（concept: 検定設計）。

例で見る

$H_0:\mu=0$ 対 $H_1:\mu=5$ 、 $\sigma=20$ 、 $n=100$ （ $\mathrm{SE}=2$ ）、片側 $\alpha=0.05$ （ $z=1.645$ ）。棄却点は $c=1.645\times2=3.29$ 。 $\beta=P(\bar X<3.29\mid\mu=5)=\Phi\!\big((3.29-5)/2\big)=\Phi(-0.855)\approx0.196$ 。よって検出力 $1-\beta\approx0.804$ （約80%）。

つまずきポイント

$\beta$ を $H_0$ のもとで計算してしまう（ $\beta$ は $H_1$ の具体的な値のもとで $\bar X<c$ となる確率。土俵は $H_1$ 側）
$\beta$ を検定固有の1つの値だと思い込む（ $\alpha$ は固定だが $\beta$ は対立仮説のどの値を仮定するかで変わる）
「第1種の過誤の方が常に重大」と一般化する（どちらが重いかは文脈依存。見逃しが致命的な場面もある）

定着クイズ

第2種の過誤 $\beta$ はどの仮説のもとで計算するか？

$H_0:\mu=0$ 対 $H_1:\mu=5$ 、 $\sigma=20$ 、 $n=100$ 、片側 $\alpha=0.05$ （棄却点 $c=3.29$ ）のときの $\beta$ は？（ $\Phi(-0.855)\approx0.196$ ）

$\alpha$ と $\beta$ の関係として正しいのは？

関連：#検出力 #仮説検定 #検定設計

この用語を扱う問題（1）

検出力統計・★★