共分散

確率・用語

ひとことで言うと

共分散 $\mathrm{Cov}(X,Y)=E[XY]-E[X]E[Y]$ は2変数が同じ方向に動くかを測る量ですが、その真価は『双線形性』にあります。各引数について線形なので、どんな複雑な線形結合の分散でも、共分散を分配していけば機械的に計算できます。自分自身との共分散は分散そのものです。

共分散の双線形性： $\mathrm{Cov}(aX+bY,Z)=a\,\mathrm{Cov}(X,Z)+b\,\mathrm{Cov}(Y,Z)$ 。各引数について線形なので分配できる。自己共分散 $\mathrm{Cov}(X,X)=\mathrm{Var}(X)$ 。例の $2\times2$ 分布では $\mathrm{Cov}(X,Y)=0.5-0.6\cdot0.6=0.14$ （正＝同方向）。

数式で表すと

$\mathrm{Cov}(X,Y)=E[XY]-E[X]E[Y]$

2変数の同時のばらつき $\mathrm{Cov}(X,Y)=E[XY]-E[X]E[Y]$ 。和の分散に $2\mathrm{Cov}$ が現れる。

共分散は

\mathrm{Cov}(X,Y)=E[(X-E[X])(Y-E[Y])]=E[XY]-E[X]E[Y]

で定義され、2つの変数が平均からどれだけ連動してずれるかを測ります（正なら同方向、負なら逆方向）。ここでは定義そのものよりも、共分散が計算道具として強力である理由——双線形性——を主軸に据えます。共分散は2つの引数のそれぞれについて線形です。すなわち、定数

a,b

と確率変数

X,Y,Z

に対して

\mathrm{Cov}(aX+bY,\,Z)=a\,\mathrm{Cov}(X,Z)+b\,\mathrm{Cov}(Y,Z)

が成り立ち、第2引数についても同様に展開できます（さらに

\mathrm{Cov}(X,c)=0

、定数は共分散に効かない）。この『各引数について線形＝双線形』という性質のおかげで、共分散は和や定数倍をまたいで自由に分配・展開できます。双線形性を繰り返し使うと、一般の線形結合の分散公式が導けます。分散は自己共分散だという事実

\mathrm{Var}(W)=\mathrm{Cov}(W,W)

から出発し、

W=\sum_i a_i X_i

とおいて双線形性で両側を展開すると

\mathrm{Var}\!\Big(\sum_i a_i X_i\Big)=\sum_i\sum_j a_i a_j\,\mathrm{Cov}(X_i,X_j)

という二重和の汎用公式になります。対角項（

i=j

）は

a_i^2\,\mathrm{Var}(X_i)

、非対角項（

i\neq j

）は

a_i a_j\,\mathrm{Cov}(X_i,X_j)

で、対称性

\mathrm{Cov}(X_i,X_j)=\mathrm{Cov}(X_j,X_i)

から非対角は2倍にまとまります。2変数に落とすと

\mathrm{Var}(aX+bY)=a^2\mathrm{Var}X+b^2\mathrm{Var}Y+2ab\,\mathrm{Cov}(X,Y)

という見慣れた式になります。もうひとつ強調したいのが、自己共分散は分散という自然な接続です。定義に

Y=X

を代入すると

\mathrm{Cov}(X,X)=E[X^2]-(E[X])^2=\mathrm{Var}(X)

となり、共分散は『分散を2変数に一般化したもの』だと分かります。数値例：

X,Y\in\{0,1\}

で

P(0,0)=0.3,P(0,1)=0.1,P(1,0)=0.1,P(1,1)=0.5

。

E[X]=0.6,E[Y]=0.6,E[XY]=0.5

。

\mathrm{Cov}(X,Y)=0.5-0.36=0.14>0

（同方向）。

\mathrm{Cov}(X,X)=0.6-0.36=0.24=\mathrm{Var}(X)

。

試験に出る性質

定義

$\mathrm{Cov}(X,Y)=E[XY]-E[X]E[Y]$ 。正なら同方向、負なら逆方向に連動。単位は $X,Y$ の積の次元をもつ。

双線形性

$\mathrm{Cov}(aX+bY,Z)=a\mathrm{Cov}(X,Z)+b\mathrm{Cov}(Y,Z)$ 。各引数について線形なので和・定数倍を自由に分配できる。

自己共分散＝分散

$\mathrm{Cov}(X,X)=E[X^2]-(E[X])^2=\mathrm{Var}(X)$ 。共分散は分散の2変数への自然な拡張。

対称性・定数で0

$\mathrm{Cov}(X,Y)=\mathrm{Cov}(Y,X)$ 、 $\mathrm{Cov}(X,c)=0$ （定数は連動しない）。

一般線形結合の分散

双線形性から $\mathrm{Var}(\sum a_iX_i)=\sum_i\sum_j a_ia_j\mathrm{Cov}(X_i,X_j)$ 。和・差・線形結合の公式の母体。

例で見る

$X,Y\in\{0,1\}$ 、 $P(0,0)=0.3,P(0,1)=0.1,P(1,0)=0.1,P(1,1)=0.5$ 。 $E[X]=0.6,E[Y]=0.6,E[XY]=P(1,1)=0.5$ 。 $\mathrm{Cov}(X,Y)=0.5-0.6\cdot0.6=0.14>0$ （同方向）。自己共分散： $E[X^2]=0.6$ より $\mathrm{Cov}(X,X)=0.6-0.36=0.24=\mathrm{Var}(X)$ 。

つまずきポイント

双線形性で定数の扱いを誤る（ $\mathrm{Cov}(aX+c,Y)=a\mathrm{Cov}(X,Y)$ 。加える定数 $c$ は共分散に効かず、係数 $a$ だけが前に出る）
$\mathrm{Cov}(X,X)$ を $0$ や $1$ と思う（自分自身との共分散は分散 $\mathrm{Var}(X)$ になる。一般に非零）
共分散の大きさで関係の強さを比べる（共分散は単位に依存。強さの比較は標準化した相関係数 $\rho$ で行う）

定着クイズ

共分散の双線形性 $\mathrm{Cov}(aX+bY,Z)$ は？

自己共分散 $\mathrm{Cov}(X,X)$ は何に等しい？

$X,Y\in\{0,1\}$ 、 $E[X]=E[Y]=0.6,E[XY]=0.5$ のとき $\mathrm{Cov}(X,Y)$ は？

関連：#相関 #相関係数 #多項分布 #無相関 #和

この用語を扱う問題（2）