acpass

統計用語

ひとことで言うと

母分散が分からず、標本も小さいときに母平均を検定する方法です。母分散を標本分散で代用するぶん不確かさが増えるので、正規分布ではなく裾の厚い tt 分布を基準に使います。これが「だから少し棄却しにくくなる」効果を生みます。

標準正規曲線(緑)とt(15)曲線(赤破線)を重ねた図。t分布は裾が厚いぶん両側5%の臨界値が1.96より大きい2.131になり、同じ統計量2.0でも正規なら棄却・tなら棄却できない違いを示すt分布は裾が厚い→臨界値が大きい(2.131>1.96)N(0,1)t(15)1.962.131統計量

標準正規(緑)と t(15)t(15)(赤破線)。裾が厚いぶん臨界値が 2.131>1.962.131>1.96 となり、統計量 2.02.0 でも正規なら棄却・tt では棄却できない。

数式で表すと

t=Xˉμ0s/nt(n1)t=\dfrac{\bar X-\mu_0}{s/\sqrt{n}}\sim t(n-1)

母分散未知・小標本で母平均を検定する。統計量は自由度 n1n-1tt 分布に従う。

t検定は、母分散 σ2\sigma^2 が未知で標本サイズも小さいときに母平均 μ\mu を検定する方法です。母分散既知のz検定と違い、σ\sigma を標本標準偏差 ss で代用するため、基準分布が正規分布から裾の厚い tt 分布(concept: t分布)に変わります。一標本t検定の統計量は t=Xˉμ0s/nt=\dfrac{\bar X-\mu_0}{s/\sqrt{n}} で、H0:μ=μ0H_0:\mu=\mu_0 のもとで自由度 n1n-1tt 分布に従います。 concept: 仮説検定の例と同じ統計量 2.02.0 で対比してみましょう。n=16n=16(自由度15)、Xˉ=52\bar X=52s=8s=8μ0=48\mu_0=48 のとき t=(5248)/(8/16)=4/2=2.0t=(52-48)/(8/\sqrt{16})=4/2=2.0。正規の臨界値 1.961.96 なら棄却ですが、tt の臨界値 t0.025,15=2.131t_{0.025,15}=2.131 なら t=2.0<2.131|t|=2.0<2.131 で棄却できません。これは「σ\sigmass で代用した不確かさのぶん、慎重に判定する」という保守性の表れです。 t2F(1,k)t^2\sim F(1,k) の関係(concept: F分布)から、両側5%臨界値は 2.1312=4.541=F0.05,1,152.131^2=4.541=F_{0.05,1,15} と一致します。二標本に拡張すれば、等分散仮定下ではプールt検定(自由度 n1+n22n_1+n_2-2)、不等分散ではウェルチのt検定を使います。母分散既知なら正規、未知ならt——この切り替えが判断の基本軸です。

試験に出る性質

使う場面

母分散 σ2\sigma^2 未知・小標本で母平均 μ\mu を検定。σ\sigmass で代用するため基準分布が tt になる。

統計量と自由度

t=Xˉμ0s/nt=\dfrac{\bar X-\mu_0}{s/\sqrt n}、自由度 n1n-1(一標本)。σ\sigma を推定した分だけ自由度が1減る。

裾が厚く保守的

臨界値が正規より大きい(自由度15で 2.131>1.962.131>1.96)。同じ統計量でも棄却しにくい。

z検定との対比

母分散既知→z検定(正規)、未知→t検定。同じ 2.02.0 でもz:棄却/t:棄却せずになりうる。

二標本への拡張

等分散→プールt(自由度 n1+n22n_1+n_2-2)、不等分散→ウェルチのt(自由度補正)。

例で見る

n=16n=16(自由度15)、Xˉ=52\bar X=52s=8s=8μ0=48\mu_0=48t=(5248)/(8/4)=2.0t=(52-48)/(8/4)=2.0。 臨界値 t0.025,15=2.131t_{0.025,15}=2.131t=2.0<2.131|t|=2.0<2.131 なので棄却できない(z検定の臨界値 1.961.96 なら棄却だったのと対照的)。

つまずきポイント

  • 母分散 σ\sigma が既知なのにt検定を使う(既知ならz検定でよい)
  • 自由度を nn と間違える(一標本は n1n-1
  • 母分散未知なのにz検定を使う(ss で代用した不確かさを無視してしまう)

定着クイズ

t検定を使うのはどんな場面か?

n=16n=16Xˉ=52\bar X=52s=8s=8μ0=48\mu_0=48 のときの tt 値は?

同じ統計量 2.02.0 でz検定なら棄却・t検定では棄却できないのはなぜ?

この用語を扱う問題(2