有効性

統計・用語

ひとことで言うと

有効性とは、複数の不偏推定量を比べたとき『分散が小さいほうが優れている』という考え方です。どちらも平均的には当たる（不偏）なら、ばらつきが小さいほど一発の推定が信頼できます。分散が最小の不偏推定量がいわば『チャンピオン』で、これをUMVUE（一様最小分散不偏推定量）と呼びます。

$N(\mu,\sigma^2)$ で $\mu$ を推定。標本平均 $\bar X$ （緑・細い）は分散 $\sigma^2/n$ 、標本中央値（灰・広い）は漸近分散 $\pi\sigma^2/(2n)$ 。相対有効性 $\mathrm{RE}=2/\pi\approx0.637$ で $\bar X$ が有効、CR下限を達成するUMVUE。

数式で表すと

$\mathrm{Var}(\hat\theta_1)<\mathrm{Var}(\hat\theta_2)\Rightarrow \hat\theta_1\ \text{が有効}$

不偏推定量どうしを分散（不偏なら平均二乗誤差に一致）で比較し、より小さいほうを有効という。分散最小の不偏推定量が有効推定量。

有効性は、2つ以上の不偏推定量を分散で比較する考え方です。前提として両方が不偏なら、MSEは分散に一致するので、分散の小さいほうが総合的にも優れています。不偏推定量

\hat\theta_1,\hat\theta_2

について

\mathrm{Var}(\hat\theta_1)<\mathrm{Var}(\hat\theta_2)

なら『

\hat\theta_1

のほうが有効』といいます。比較を数値で表すのが相対有効性(RE)です。

\mathrm{RE}=\mathrm{Var}(\hat\theta_2)/\mathrm{Var}(\hat\theta_1)

の形で分散比をとります。例として

N(\mu,\sigma^2)

から

\mu

を推定する、標本平均

\bar X

と標本中央値を比べます。

\bar X

の分散は

\sigma^2/n

。正規分布の標本中央値の漸近分散は

\pi\sigma^2/(2n)

です。相対有効性は

\mathrm{RE}=\frac{\mathrm{Var}(\bar X)}{\mathrm{Var}(\text{中央値})}=\frac{\sigma^2/n}{\pi\sigma^2/(2n)}=\frac{2}{\pi}\approx0.637

となり、

\bar X

は中央値より約57%効率的です。では『どこまで小さくできるか』の到達点がUMVUE（一様最小分散不偏推定量）です。すべての不偏推定量の中で分散が最小になる推定量で、理論的な下限はクラメール–ラオ下限

1/(nI(\theta))

です。

\bar X

は正規

N(\mu,\sigma^2)

で

\mathrm{Var}=\sigma^2/n

がCR下限に等しく、

\mu

のUMVUEになっています。UMVUEを構成する実践的な道具が十分統計量とラオ–ブラックウェルの定理で、『不偏推定量を十分統計量で条件付ければ分散が下がる』ことからUMVUEは十分統計量の関数の中に現れます。

試験に出る性質

有効性の定義

不偏推定量どうしを分散で比較し、小さいほうが有効。不偏なら $\mathrm{MSE}=\mathrm{Var}$ なので分散比較で十分。

相対有効性(RE)

$\mathrm{RE}=\mathrm{Var}(\hat\theta_2)/\mathrm{Var}(\hat\theta_1)$ 。分散比で効率を数値化する。

正規での平均vs中央値

$\mathrm{Var}(\bar X)=\sigma^2/n$ 、中央値の漸近分散 $\pi\sigma^2/(2n)$ 。 $\mathrm{RE}=2/\pi\approx0.637$ で $\bar X$ が有効。

UMVUE

全不偏推定量中で分散が一様に最小の推定量。CR下限 $1/(nI(\theta))$ を達成すればUMVUE。

十分統計量との接続

ラオ–ブラックウェルにより、UMVUEは十分統計量の関数の中に探せる。

例で見る

$N(\mu,\sigma^2)$ から $\mu$ を推定。 $\bar X$ : $\mathrm{Var}=\sigma^2/n$ （CR下限達成→UMVUE）。標本中央値: 漸近分散 $\pi\sigma^2/(2n)$ 。 $\mathrm{RE}=\frac{2}{\pi}\approx0.637$ 。 $\bar X$ は中央値より約57%効率的。

つまずきポイント

偏りのある推定量どうしを分散だけで比べる（有効性の比較は不偏推定量に限る。偏りがあればMSEで比較）
中央値のほうが外れ値に強いから常に良いと思う（頑健性は別の長所。正規では $\bar X$ が分散小さく有効）
UMVUEが必ず存在すると思う（CR下限を達成する不偏推定量がない場合もある）

定着クイズ

2つの不偏推定量の有効性はどう比べる？

$N(\mu,\sigma^2)$ で $\bar X$ と標本中央値の $\mathrm{Var}(\bar X)/\mathrm{Var}(\text{中央値})$ は？

UMVUEとは？

関連：#不偏推定量 #平均二乗誤差 #フィッシャー情報量 #MLE

この用語を扱う問題（1）

推定量の有効性統計・★★