acpass

不偏推定量

知識マップ

統計用語

ひとことで言うと

推定量を何度も繰り返し計算したときの「平均的なズレ」がゼロであることです。1回の標本では真の値からズレることがあっても、長期的に見れば偏りなく真の値の周りに散らばる推定量です。

こんなデータが従う

標本平均は母平均の不偏推定量標本分散をn-1で割ると母分散の不偏推定量になる回帰係数の最小二乗推定量比率pの標本比率p̂最尤推定量は一般に不偏とは限らない例

推定量を選ぶときの基本的な良さの基準の一つです。不偏性だけでなく分散の小ささ(有効性)も合わせて評価するのが実務的です。

真の値θに中心が一致する推定量の分布(不偏)と、中心が右にズレた推定量の分布(偏りあり)の比較真の値θ不偏:中心がθに一致偏りあり:中心がズレる推定量の値

真の値θに分布の中心が一致する推定量(不偏、実線)と、中心がズレている推定量(偏りあり、破線)の比較。

数式で表すと

E[θ^]=θE[\hat\theta]=\theta

期待値が真値に等しい推定量。標本分散は n1n-1 で割ると不偏になる。

推定量 θ^\hat\theta が不偏であるとは、E[θ^]=θE[\hat\theta]=\theta(真の値)が常に成り立つことです。偏り(バイアス)は Bias(θ^)=E[θ^]θ\mathrm{Bias}(\hat\theta)=E[\hat\theta]-\theta と定義され、不偏推定量はバイアスがゼロの推定量にあたります。 代表例が標本分散です。標本平均からの偏差の二乗和を単純にnで割ると母分散を少し過小評価してしまいます(標本平均自体がデータから推定された値であるため、自由度が1つ減るのが原因)。これを補正するため、n1n-1 で割った S2=1n1i=1n(XiXˉ)2S^2=\dfrac1{n-1}\sum_{i=1}^n(X_i-\bar X)^2 が母分散σ²の不偏推定量として使われます。 不偏性は「良い推定量」の必要条件ではありません。実務では、不偏性に加えて分散の小ささ(有効性)や一致性(標本数を増やすと真の値に収束する性質)も合わせて評価します。最尤推定量(concept: MLE)は不偏とは限りませんが、一致性をもち漸近的に効率的という別の強みがあります。

試験に出る性質

不偏性の定義

E[θ^]=θE[\hat\theta]=\theta

バイアス

Bias(θ^)=E[θ^]θ\mathrm{Bias}(\hat\theta)=E[\hat\theta]-\theta。不偏ならBias=0。

標本分散はn-1で割る

S2=1n1(XiXˉ)2S^2=\frac1{n-1}\sum(X_i-\bar X)^2 がσ²の不偏推定量。nで割ると過小評価になる(自由度の補正)。

不偏性は唯一の基準ではない

分散の小ささ(有効性)・一致性も重要で、不偏性だけでは推定量の良さを決められない。

不偏推定量の線形和

不偏推定量どうしの線形結合(重みの合計が1)も不偏になる。

例で見る

n=5の標本で (XiXˉ)2=80\sum(X_i-\bar X)^2=80 のとき、母分散の不偏推定量は S2=80/(51)=20S^2=80/(5-1)=20。nで割った 80/5=1680/5=16 は過小評価になる。

つまずきポイント

  • 標本分散を計算するときnで割ってしまう(n-1で割るのが正しい不偏推定量)
  • 不偏性=良い推定量と思い込み、分散の大小を考慮しない
  • 1回の標本での推定値と真の値が一致しないことを「不偏性が崩れている」と誤解する(不偏性は期待値の話であり、1回の結果が一致するとは限らない)

定着クイズ

n=6の標本で偏差二乗和が50のとき、母分散の不偏推定量S²は?

推定量θ̂が不偏であるとはどういう意味か?

標本分散をnで割った場合、母分散と比べてどうなるか?

この用語を扱う問題(3