acpass

モデリング用語

ひとことで言うと

時系列とは時間順に並んだ確率過程で、隣り合う時点の値が互いに相関しているのが特徴です。その『時間的な記憶』を数値化する道具が自己共分散 γk\gamma_k と自己相関 ρk\rho_k で、ラグ kk だけ離れた値どうしがどれだけ連動するかを測ります。定常な時系列は、この γk\gamma_k の並びによって『指紋』のように特徴づけられます。

AR(1)でφ=0.8の自己共分散γ_k(緑)と自己相関ρ_k(赤)をラグkごとに並べた棒グラフ。γ_0から始まりγ_k=φ^k・γ_0で指数減衰、ρ_k=γ_k/γ_0=φ^kでρ_0=1,ρ_1=0.8,ρ_2=0.64と減衰する。定常時系列を指紋のように特徴付けるγ_k=φ^k・γ_0(緑,絶対), ρ_k=φ^k(赤,正規化)で指数減衰k=0k=1k=2k=3k=4k=5大きさラグk

AR(1) ϕ=0.8\phi=0.8 の自己共分散 γk\gamma_k(緑・絶対スケール)と自己相関 ρk\rho_k(赤・正規化)。γ02.778\gamma_0\approx2.778 から指数減衰し、ρk=ϕk\rho_k=\phi^k1-111 に収まる。定常時系列を指紋のように特徴づける。

数式で表すと

γk=Cov(Yt,Ytk)\gamma_k=\mathrm{Cov}(Y_t,Y_{t-k})

時間順に並んだ確率過程。定常性・自己相関で構造を捉え、AR/MA でモデル化する。

時系列とは、時間 tt の順に並んだ確率変数の列 {Yt}\{Y_t\}(確率過程)です。普通の独立標本と違い、近い時点どうしの値は相関をもつ——つまり『時間的な記憶』がある——のが本質で、その記憶の構造を捉えるのが時系列解析の出発点になります。 記憶を数値化する中心的な道具が自己共分散関数 γk\gamma_k です。ラグ kk だけ離れた2時点の共分散として γk=Cov(Yt,Ytk)\gamma_k=\mathrm{Cov}(Y_t,Y_{t-k}) と定義します。k=0k=0 のときは γ0=Var(Yt)\gamma_0=\mathrm{Var}(Y_t) で、ただの分散になります。定常な時系列では γk\gamma_k が時点 tt によらずラグ kk だけで決まるので、γ0,γ1,γ2,\gamma_0,\gamma_1,\gamma_2,\dots という数列がその過程を特徴づける『指紋』になります。 自己共分散はスケール依存なので、γ0\gamma_0 で割って正規化したものが自己相関関数 ρk\rho_k です。 ρk=γkγ0\rho_k=\dfrac{\gamma_k}{\gamma_0} これは必ず 1ρk1-1\le\rho_k\le1 に収まり、ρ0=1\rho_0=1 から始まります。ρk\rho_k をラグごとに並べた図がコレログラム(ACF)で、時系列の記憶のパターンが一目で読み取れます。 この γk,ρk\gamma_k,\rho_k の減り方を見ると、AR と MA の『記憶の長さ』の違いがくっきり現れます。AR(自己回帰)は無限の記憶をもち、ρk\rho_k は指数的に減衰するが完全には 00 になりません(AR(1) なら ρk=ϕk\rho_k=\phi^k)。一方 MA(移動平均)は有限の記憶しかもたず、MA(qq) では ρk\rho_k がラグ qq を超えるとぴたりと 00 に打ち切られます。つまり『尾を引けば AR、急に切れれば MA』で、自己相関の形がモデル選択の手がかりになります。 具体例として AR(1) で ϕ=0.8,σ2=1\phi=0.8,\sigma^2=1 とすると、γ0=1/(10.64)2.778\gamma_0=1/(1-0.64)\approx2.778ρ1=0.8,ρ2=0.64=ϕ2\rho_1=0.8,\rho_2=0.64=\phi^2 となって公式 ρk=ϕk\rho_k=\phi^k を満たします。

試験に出る性質

自己共分散関数

γk=Cov(Yt,Ytk)\gamma_k=\mathrm{Cov}(Y_t,Y_{t-k})。ラグ kk 離れた値の共分散。k=0k=0 では γ0=Var(Yt)\gamma_0=\mathrm{Var}(Y_t)

自己相関関数

ρk=γk/γ0\rho_k=\gamma_k/\gamma_0γ0\gamma_0 で正規化したもので 1ρk1-1\le\rho_k\le1ρ0=1\rho_0=1。スケールに依存しない記憶の強さ。

定常なら指紋になる

定常時系列では γk\gamma_ktt によらずラグ kk だけで決まる。数列 {γk}\{\gamma_k\} がその過程を特徴づける。

ARは無限の記憶(指数減衰)

AR は ρk\rho_k が指数的に減衰するが完全には 00 にならない。AR(1) では ρk=ϕk\rho_k=\phi^k で尾を引く。

MAは有限の記憶(打ち切り)

MA(qq) は ρk\rho_k がラグ qq を超えるとぴたり 00。MA(1) はラグ2以降 00。尾を引けばAR・急に切れればMA。

例で見る

AR(1) で ϕ=0.8,σ2=1\phi=0.8,\sigma^2=1 とする。γ0=1/(1ϕ2)=1/0.362.778\gamma_0=1/(1-\phi^2)=1/0.36\approx2.778ρ1=0.8,ρ2=0.64=ϕ2\rho_1=0.8,\rho_2=0.64=\phi^2 で公式 ρk=ϕk\rho_k=\phi^k を満たす。 自己共分散は絶対スケール(2.778\approx2.778)、自己相関は 1-111 に正規化されている対比。

つまずきポイント

  • 自己共分散 γk\gamma_k と自己相関 ρk\rho_k を混同する(γk\gamma_k はスケール依存、ρk=γk/γ0\rho_k=\gamma_k/\gamma_01-111 に正規化。ρ0\rho_0 は必ず 11
  • 非定常な系列で γk\gamma_k がラグだけで決まると思う(γk\gamma_ktt によらないのは定常な場合。トレンドがあると tt に依存する)
  • ARとMAの記憶を取り違える(AR は指数減衰で尾を引く=無限の記憶、MA はラグ qq で打ち切り=有限の記憶)

定着クイズ

自己共分散関数 γk\gamma_k の定義は?

自己相関 ρk\rho_k と自己共分散 γk\gamma_k の関係は?

ARとMAの『記憶』の違いで正しいのは?

この用語を扱う問題(1