最小二乗法
知識マップ統計・用語
ひとことで言うと
最小二乗法は『データ点と直線の縦のズレ(残差)を二乗して全部足したものを、いちばん小さくする直線を選ぶ』という、回帰直線の決め方そのものです。なぜ二乗なのか、どう解くのか——偏微分してゼロとおく『正規方程式』を立てれば、係数が一意に求まります。
5点 への最小二乗回帰直線 (緑)。各点から直線へ下ろした縦の破線が残差 。残差平方和 を最小にする直線が解で、最適解では かつ 。
数式で表すと
残差平方和を最小化して回帰係数を求める方法。正規方程式の解。
試験に出る性質
目的関数
残差平方和 を最小化する。二乗は微分可能で大きなズレを強く罰するので解が一意に定まる。
正規方程式
の連立。これを解くと が得られる。
残差の和はゼロ
最適解では 。直線は点の重心 を必ず通る。
残差は説明変数と直交
最適解では 。残差に で説明できる成分が残っていない(直交条件)。
y方向の最小化・非対称
縦のズレを最小化するので を入れ替えると別の直線になる。外れ値に引きずられやすい点にも注意。
例で見る
。。 より 、。予測値 。 残差 。、。SSE 。
つまずきポイント
- 最小化しているのを『点から直線への垂線距離』だと誤解する(最小二乗は 方向の縦のズレの二乗和。 入替で別の直線になる)
- 正規方程式を立てずに公式 を暗記だけで使う(公式は偏微分=0を解いた結果。導出元の を押さえる)
- 外れ値の影響を軽視する(二乗が大きなズレを強調するため、1点の異常値で直線が大きく動くことがある)
定着クイズ
最小二乗法が最小化するのは?
最小二乗解で残差が満たす条件は?
()の傾き は?
この用語を扱う問題(1)