acpass

検定設計

知識マップ

統計用語

ひとことで言うと

検定を「やってみる」前に、要求する有意水準 α\alpha と検出力 1β1-\beta を満たすには標本がいくつ必要かを逆算しておく設計の作業です。効果量(見つけたい差の大きさ)とばらつき σ\sigma から、必要な標本数 nn が決まります。

必要標本数nと効果量δの関係を示す反比例カーブ。n=σ²(z_α+z_β)²/δ²でnはδ²に反比例し、効果量が小さいほど必要nが急増する。δ=5のとき必要nは約99で、これは検出力80%設計に対応する必要標本数nは効果量δの2乗に反比例(δ小→n急増)δ=5n≈99必要n効果量 δ

必要標本数 nn と効果量 δ\delta の関係を示す反比例カーブ。n=σ2(zα+zβ)2/δ2n=\sigma^2(z_\alpha+z_\beta)^2/\delta^2nnδ2\delta^2 に反比例し、効果量が小さいほど必要 nn が急増する。δ=5\delta=5 のとき必要 n99n\approx99 で、これは検出力80%の設計に対応する。

数式で表すと

n を α,1β,効果量から決定n\ \text{を}\ \alpha,\,1-\beta,\,\text{効果量から決定}

要求する有意水準 α\alpha と検出力 1β1-\beta を満たすように棄却域や必要標本サイズを設計すること。効果量と nn から所要検出力を逆算する。

検定設計とは、データを取る前に「要求する有意水準 α\alpha と検出力 1β1-\beta を同時に満たすには、棄却域をどこに置き、標本サイズ nn をいくつにすればよいか」を決める作業です。concept: 検出力・concept: 第2種の過誤で見たように、α\alpha を固定したまま β\beta も小さく(検出力を高く)したいなら、2つの分布の重なりを減らすために nn を増やすしかありません。では具体的にいくつ必要か。片側検定で母分散 σ2\sigma^2 が既知、効果量(見つけたい平均差)を δ=μ1μ0\delta=\mu_1-\mu_0 とすると、必要標本数は n=σ2(zα+zβ)2δ2n=\dfrac{\sigma^2(z_\alpha+z_\beta)^2}{\delta^2} で逆算できます(zαz_\alpha は有意水準 α\alpha の臨界値、zβz_\beta は検出力 1β1-\beta に対応する点)。両側検定なら zαz_\alphazα/2z_{\alpha/2} に置き換えます。 この式は形だけで2つの大事な性質を語っています。nnσ2\sigma^2 に比例し、δ2\delta^2 に反比例します。つまりばらつきが大きいほど多くの標本が要り、見つけたい差 δ\delta が小さいほど必要 nn が急激に(2乗で)増えます。図の反比例カーブが、δ\delta を半分にすると nn が4倍に跳ね上がる様子を示しています。 concept: 第2種の過誤と同じ数値で検算してみます。α=0.05\alpha=0.05(片側、zα=1.645z_\alpha=1.645)、目標検出力80%(β=0.20\beta=0.20zβ=0.84z_\beta=0.84)、σ=20\sigma=20、効果量 δ=5\delta=5 とすると n=202×(1.645+0.84)252=400×2.485225=400×6.17525=98.8n=\dfrac{20^2\times(1.645+0.84)^2}{5^2}=\dfrac{400\times2.485^2}{25}=\dfrac{400\times6.175}{25}=98.8 です。標本数は整数で、しかも目標検出力を割り込んではいけないので、必ず切り上げて n=99n=99(実務上はきりよく n=100n=100 程度)とします。これは concept: 第2種の過誤の例で「n=100n=100 のとき実際の検出力が約80.4%」だったことときれいに整合します。必要 n=98.8n=98.8 を切り上げて n=100n=100 にしたぶん、目標の80%をほんのわずか上回るわけです。逆に言えば、もし切り捨てて n=98n=98 にしてしまうと、目標の80%をわずかに下回ってしまいます。だから検定設計では端数は常に切り上げる、というのが鉄則になります。

試験に出る性質

目的

要求する α\alpha と検出力 1β1-\beta を満たすよう、棄却域や必要標本数 nn を事前に設計する。

必要標本数の公式

片側で n=σ2(zα+zβ)2δ2n=\dfrac{\sigma^2(z_\alpha+z_\beta)^2}{\delta^2}δ\delta=効果量)。両側は zαzα/2z_\alpha\to z_{\alpha/2}

$\sigma^2$ に比例・$\delta^2$ に反比例

ばらつきが大きいほど nn 増、効果量 δ\delta が小さいほど nn は2乗で急増する。

端数は切り上げ

nn は整数かつ目標検出力を割らないよう、計算値を必ず切り上げる。切り下げると検出力不足。

例の整合

α=0.05, 1β=0.8, σ=20, δ=5\alpha=0.05,\ 1-\beta=0.8,\ \sigma=20,\ \delta=5n=98.899n=98.8\to99。concept: 第2種の過誤の n=100n=100 で検出力80.4%と整合。

例で見る

α=0.05\alpha=0.05(片側 zα=1.645z_\alpha=1.645)、目標検出力80%(zβ=0.84z_\beta=0.84)、σ=20\sigma=20、効果量 δ=5\delta=5 のとき n=202×(1.645+0.84)252=400×6.17525=98.8n=\dfrac{20^2\times(1.645+0.84)^2}{5^2}=\dfrac{400\times6.175}{25}=98.8。 切り上げて n=99n=99(実務上は n=100n=100 程度)。concept: 第2種の過誤の例(n=100n=100 で検出力約80.4%)と整合する。

つまずきポイント

  • 必要 nn を切り下げてしまう(目標検出力を下回る。nn は必ず切り上げる)
  • 両側検定なのに zαz_\alpha を使う(両側では zα/2z_{\alpha/2} が正しい。片側のままだと水準がずれる)
  • 必要 nn が大きいことを「設計が悪い」と捉える(効果量が小さい・ばらつきが大きいことの正しい反映で、むしろ正常に機能している)

定着クイズ

片側検定で必要標本数 nn を求める公式は?

α=0.05\alpha=0.05zα=1.645z_\alpha=1.645)、検出力80%(zβ=0.84z_\beta=0.84)、σ=20\sigma=20δ=5\delta=5 のときの必要 nn は?

必要 nn が大きく出たときの正しい受け止め方は?

この用語を扱う問題(1

検定設計とは|定義・公式とアクチュアリー試験の関連問題 | acpass