時系列

モデリング・用語

ひとことで言うと

時系列とは時間順に並んだ確率過程で、隣り合う時点の値が互いに相関しているのが特徴です。その『時間的な記憶』を数値化する道具が自己共分散 $\gamma_k$ と自己相関 $\rho_k$ で、ラグ $k$ だけ離れた値どうしがどれだけ連動するかを測ります。定常な時系列は、この $\gamma_k$ の並びによって『指紋』のように特徴づけられます。

AR(1) $\phi=0.8$ の自己共分散 $\gamma_k$ （緑・絶対スケール）と自己相関 $\rho_k$ （赤・正規化）。 $\gamma_0\approx2.778$ から指数減衰し、 $\rho_k=\phi^k$ は $-1$ 〜 $1$ に収まる。定常時系列を指紋のように特徴づける。

数式で表すと

$\gamma_k=\mathrm{Cov}(Y_t,Y_{t-k})$

時間順に並んだ確率過程。定常性・自己相関で構造を捉え、AR/MA でモデル化する。

時系列とは、時間

t

の順に並んだ確率変数の列

\{Y_t\}

（確率過程）です。普通の独立標本と違い、近い時点どうしの値は相関をもつ——つまり『時間的な記憶』がある——のが本質で、その記憶の構造を捉えるのが時系列解析の出発点になります。記憶を数値化する中心的な道具が自己共分散関数

\gamma_k

です。ラグ

k

だけ離れた2時点の共分散として

\gamma_k=\mathrm{Cov}(Y_t,Y_{t-k})

と定義します。

k=0

のときは

\gamma_0=\mathrm{Var}(Y_t)

で、ただの分散になります。定常な時系列では

\gamma_k

が時点

t

によらずラグ

k

だけで決まるので、

\gamma_0,\gamma_1,\gamma_2,\dots

という数列がその過程を特徴づける『指紋』になります。自己共分散はスケール依存なので、

\gamma_0

で割って正規化したものが自己相関関数

\rho_k

です。

\rho_k=\dfrac{\gamma_k}{\gamma_0}

これは必ず

-1\le\rho_k\le1

に収まり、

\rho_0=1

から始まります。

\rho_k

をラグごとに並べた図がコレログラム（ACF）で、時系列の記憶のパターンが一目で読み取れます。この

\gamma_k,\rho_k

の減り方を見ると、AR と MA の『記憶の長さ』の違いがくっきり現れます。AR（自己回帰）は無限の記憶をもち、

\rho_k

は指数的に減衰するが完全には

0

になりません（AR(1) なら

\rho_k=\phi^k

）。一方 MA（移動平均）は有限の記憶しかもたず、MA(

q

) では

\rho_k

がラグ

q

を超えるとぴたりと

0

に打ち切られます。つまり『尾を引けば AR、急に切れれば MA』で、自己相関の形がモデル選択の手がかりになります。具体例として AR(1) で

\phi=0.8,\sigma^2=1

とすると、

\gamma_0=1/(1-0.64)\approx2.778

、

\rho_1=0.8,\rho_2=0.64=\phi^2

となって公式

\rho_k=\phi^k

を満たします。

試験に出る性質

自己共分散関数

$\gamma_k=\mathrm{Cov}(Y_t,Y_{t-k})$ 。ラグ $k$ 離れた値の共分散。 $k=0$ では $\gamma_0=\mathrm{Var}(Y_t)$ 。

自己相関関数

$\rho_k=\gamma_k/\gamma_0$ 。 $\gamma_0$ で正規化したもので $-1\le\rho_k\le1$ 、 $\rho_0=1$ 。スケールに依存しない記憶の強さ。

定常なら指紋になる

定常時系列では $\gamma_k$ が $t$ によらずラグ $k$ だけで決まる。数列 $\{\gamma_k\}$ がその過程を特徴づける。

ARは無限の記憶（指数減衰）

AR は $\rho_k$ が指数的に減衰するが完全には $0$ にならない。AR(1) では $\rho_k=\phi^k$ で尾を引く。

MAは有限の記憶（打ち切り）

MA( $q$ ) は $\rho_k$ がラグ $q$ を超えるとぴたり $0$ 。MA(1) はラグ2以降 $0$ 。尾を引けばAR・急に切れればMA。

例で見る

AR(1) で $\phi=0.8,\sigma^2=1$ とする。 $\gamma_0=1/(1-\phi^2)=1/0.36\approx2.778$ 。 $\rho_1=0.8,\rho_2=0.64=\phi^2$ で公式 $\rho_k=\phi^k$ を満たす。自己共分散は絶対スケール（ $\approx2.778$ ）、自己相関は $-1$ 〜 $1$ に正規化されている対比。

つまずきポイント

自己共分散 $\gamma_k$ と自己相関 $\rho_k$ を混同する（ $\gamma_k$ はスケール依存、 $\rho_k=\gamma_k/\gamma_0$ は $-1$ 〜 $1$ に正規化。 $\rho_0$ は必ず $1$ ）
非定常な系列で $\gamma_k$ がラグだけで決まると思う（ $\gamma_k$ が $t$ によらないのは定常な場合。トレンドがあると $t$ に依存する）
ARとMAの記憶を取り違える（AR は指数減衰で尾を引く＝無限の記憶、MA はラグ $q$ で打ち切り＝有限の記憶）

定着クイズ

自己共分散関数 $\gamma_k$ の定義は？

自己相関 $\rho_k$ と自己共分散 $\gamma_k$ の関係は？

ARとMAの『記憶』の違いで正しいのは？

関連：#AR #MA #定常性 #自己相関

この用語を扱う問題（1）

時系列MA(1)モデリング・★★