標本分散
知識マップ統計・用語
ひとことで言うと
標本分散(不偏分散) は、手元の 個のデータの散らばりから母集団の分散 を推定する量です。最大のポイントは『なぜ ではなく で割るのか』。データから平均 を先に計算した時点で偏差の合計が必ず0になる『縛り』が入るため、自由に動ける情報は 個ぶんしかないのです。
標本 、 の偏差 。正の偏差(緑)と負の偏差(赤)の和は必ず0になり、最後の1個は他から自動的に決まる。だから自由な偏差は 個ぶんで、不偏分散は 。
数式で表すと
で割る不偏分散 。正規母集団では 。
試験に出る性質
定義(n-1で割る)
。母分散の式が で割るのに対し、標本分散はあえて (自由度)で割る。
不偏性
。 で割ると と過小評価。 で割ることでこの偏りが消える。
自由度の直感
偏差の和 という制約で、自由に動けるのは 個ぶん。失われた1自由度を補うのが 。
正規母集団での分布
なら 。自由度 は偏差の和=0の制約の反映。分散の区間推定・検定の土台。
標準偏差は不偏でない
は不偏でも、 は平方根が非線形なため一般に 。標準偏差は厳密には不偏推定量ではない。
例で見る
、。標本平均 。 偏差 (和は0)。二乗和 。 不偏分散 。もし で割ると で を過小評価。正規母集団なら 。
つまずきポイント
- 母分散と同じく で割ってしまう(標本から平均を推定したぶん1自由度失うので で割る。 で割ると過小評価して偏る)
- が不偏だから標準偏差 も不偏だと思う(平方根が非線形なので一般に 。 は厳密には不偏でない)
- の自由度を と取り違える(自由度は 。偏差の和=0の制約で1つ失われるため)
定着クイズ
標本分散(不偏分散) が ではなく で割る理由は?
の不偏分散 は?(、二乗和=40)
正規母集団 のとき が従う分布は?
この用語を扱う問題(1)