標本平均
知識マップ統計・用語
ひとことで言うと
母集団から取った標本を単純に平均したものです。母平均を言い当てるための最も基本的な道具で、標本を増やすほど真の値の近くに集まり安定します。
こんなデータが従う
死亡率推定のための観測死亡者数の平均保険金請求額の標本平均健康診断データの平均値テストの平均点世論調査の支持率(比率も平均の一種)
母集団全体を観測できないときに、標本から母数(母平均)を推測する最も基本的な統計量です。
母集団の分布(広い破線)と標本平均の分布(狭い実線)の比較。中心は同じだが、標本平均の散らばりはσ²/nに小さくなる。
数式で表すと
標本の算術平均 。母平均の不偏推定量で、分散は 。
試験に出る性質
期待値
。標本平均は母平均の不偏推定量。
分散
(独立性が前提)。
標準誤差
。nを4倍にすると誤差は半分になる。
分布の近似
nが大きいと (CLT)。
独立性の前提
観測値が独立でない(例:時系列データ)と の公式はそのまま使えない。
例で見る
母分散σ²=100の母集団からn=25個取った標本平均の標準誤差は 。nを100に増やすと で、nを4倍にすると誤差は半分(√4=2倍改善)になる。
つまずきポイント
- Var(X̄)を求める際にnで割るのを忘れ、Var(X)=σ²のまま使ってしまう
- 観測値間に独立性がない(時系列データなど)のにVar(X̄)=σ²/nの公式をそのまま適用する
- 標本平均の「分布」(nが大きいときの近似)と「値」(1回の標本から計算された数値)を混同する
定着クイズ
σ²=36, n=9のとき標本平均の標準誤差SE(X̄)は?
独立な観測値の標本平均の分散公式は?
標本数nを4倍にすると、標準誤差は何倍になる?
この用語を扱う問題(3)