独立性
知識マップ確率・用語
ひとことで言うと
2つの確率変数 と が「対称で逆向きに動く」パターンのひとつが独立性の特殊ケースとして話題になる中央値です。ここでは、標本の真ん中の値として定義される中央値を扱います。分布形が歪んでいるとき「中心」を表す代表値として平均より頑強で、外れ値の影響を受けにくいのが特徴です。
右に裾を引く分布(例:所得分布)での最頻値・中央値・平均の位置関係。平均は右裾の外れ値に引きずられるが、中央値は分布を左右に等面積で分割する位置にあり、外れ値の影響を受けにくい。
数式で表すと
同時分布が周辺分布の積になる関係。、分散は単純に加わる。
試験に出る性質
定義
奇数 : 第 番目の値。偶数 : 第 番目と 番目の平均。
外れ値に頑強
外れ値が入っても中央値はほとんど動かない。平均は外れ値1点で大きく変わる。
母集団中央値
を満たす 。連続分布では を解く。
歪み分布での平均との差
右裾分布は平均中央値。所得・資産分布など「典型値」に中央値が適する場面。
順序統計量との対応
奇数 では 。偶数 では 。
例で見る
奇数個: 。中央値(第3番目)。平均(外れ値100に引張られる)。 偶数個: 。中央値(第2・第3番目の平均)。平均。
つまずきポイント
- 偶数個のとき真ん中の1つを選んでしまう(偶数では2つの平均をとる)
- 平均と中央値が常に等しいと思う(正規分布では一致するが、歪んだ分布では分離する)
- 母集団中央値を で定義することを忘れる(データの手順は奇偶で変わるが、母集団定義は )
定着クイズ
の中央値は?
の中央値は?
母集団中央値 はどう定義されるか?
この用語を扱う問題(2)