acpass

確率用語

ひとことで言うと

独立な2つのカイ二乗を、それぞれの自由度で割ってから比をとった分布がF分布です。「2つのばらつき(分散)の比」を扱う検定の基準分布で、分散分析や回帰の全体検定で主役になります。tt 分布とも深いつながり(t2t^2 がFになる)があります。

こんなデータが従う

2つの独立な標本分散の比2標本の分散の等質性検定(F検定)の統計量分散分析(ANOVA)のF統計量重回帰分析の全体検定のF統計量2つの正規母集団の分散比の信頼区間

F分布は分散比を測る場面に現れる。分散分析や回帰のF検定では、説明される分散と残差分散の比がF分布に従う。

F分布の密度曲線(右に長く裾を引く非対称な形)と上側臨界点より右の棄却域(斜線)。F分布は0以上の値だけをとり右に歪む非対称分布F分布:右に歪み0以上。右裾(斜線)が分散比の棄却域臨界値棄却域密度F値

F分布は0以上の値だけをとり右に歪む非対称な形。上側臨界点より右の棄却域(斜線)では、分散比が有意に大きいと判定する。

数式で表すと

F=W1/k1W2/k2F(k1,k2)F=\dfrac{W_1/k_1}{W_2/k_2}\sim F(k_1,k_2)

独立な2つのカイ二乗を自由度で割った比の分布。分散比の検定に使う。

F分布は、独立な2つのカイ二乗分布 W1χ2(k1)W_1\sim\chi^2(k_1)W2χ2(k2)W_2\sim\chi^2(k_2)(concept: χ²分布)を自由度で割った比 F=W1/k1W2/k2F(k1,k2)F=\dfrac{W_1/k_1}{W_2/k_2}\sim F(k_1,k_2) が従う分布です(k1k_1: 分子自由度、k2k_2: 分母自由度)。値は0以上で右に長い裾を引く非対称な形をとります。用途は「2つの分散(ばらつき)の比」を扱う場面——2標本のF検定、分散分析(ANOVA)、重回帰の全体検定——で、分散比が出てくる場面で必ず登場します。 最重要の関係が tt 分布との接続です。Tt(k)T\sim t(k) のとき T2F(1,k)T^2\sim F(1,k) が成り立ちます。導出は定義をたどるだけです。T=Z/W/kT=Z/\sqrt{W/k}ZN(0,1)Z\sim N(0,1)Wχ2(k)W\sim\chi^2(k)、独立)を2乗すると T2=Z2/(W/k)T^2=Z^2/(W/k)Z2χ2(1)Z^2\sim\chi^2(1) なので、これは χ2(1)/1÷χ2(k)/k\chi^2(1)/1 \div \chi^2(k)/k の形、すなわち F(1,k)F(1,k) そのものです。 数値確認:concept: t検定の例では n=16n=16(自由度15)、臨界値 t0.025,15=2.131t_{0.025,15}=2.131 でした。tα/2,k2=Fα,1,kt_{\alpha/2,k}^2=F_{\alpha,1,k} より F0.05,1,15=2.13124.541F_{0.05,1,15}=2.131^2\approx4.541。 その他の性質:逆数関係 1/F(k1,k2)F(k2,k1)1/F(k_1,k_2)\sim F(k_2,k_1)、平均 E[F]=k2/(k22)E[F]=k_2/(k_2-2)k2>2k_2>2)。

試験に出る性質

定義

F=(W1/k1)/(W2/k2)F=(W_1/k_1)/(W_2/k_2)Wiχ2(ki)W_i\sim\chi^2(k_i) 独立。値は0以上で右に歪む非対称分布。

用途

2分散の等質性検定、分散分析(ANOVA)、重回帰の全体検定など「分散比」を扱う場面の基準分布。

t分布との関係

Tt(k)T2F(1,k)T\sim t(k)\Rightarrow T^2\sim F(1,k)Z2χ2(1)Z^2\sim\chi^2(1) を使えば定義からすぐ導ける。

臨界値の関係

Fα,1,k=tα/2,k2F_{\alpha,1,k}=t_{\alpha/2,k}^2。自由度15の例では 2.13124.541=F0.05,1,152.131^2\approx4.541=F_{0.05,1,15}

逆数と平均

1/F(k1,k2)F(k2,k1)1/F(k_1,k_2)\sim F(k_2,k_1)E[F]=k2/(k22)E[F]=k_2/(k_2-2)k2>2k_2>2)。

例で見る

concept: t検定より:n=16n=16(自由度15)、t0.025,15=2.131t_{0.025,15}=2.131F0.05,1,15=t0.025,152=2.13124.541F_{0.05,1,15}=t_{0.025,15}^2=2.131^2\approx4.541tα/2,k2=Fα,1,kt_{\alpha/2,k}^2=F_{\alpha,1,k} の関係)。

つまずきポイント

  • 分子・分母の自由度の順序を取り違える(F(k1,k2)F(k_1,k_2) は分子が k1k_1、分母が k2k_2。逆数で F(k2,k1)F(k_2,k_1)
  • カイ二乗をそのまま比にする(自由度で割ってから比をとる。F=(W1/k1)/(W2/k2)F=(W_1/k_1)/(W_2/k_2)
  • t2F(1,k)t^2\sim F(1,k) の自由度を混乱する(分子自由度は必ず1。分母は tt の自由度 kk

定着クイズ

F分布の定義として正しいのは?

Tt(k)T\sim t(k) のとき T2T^2 は何に従うか?

t0.025,15=2.131t_{0.025,15}=2.131 のとき F0.05,1,15F_{0.05,1,15} は?

この用語を扱う問題(1