モデリング・用語
ひとことで言うと
時系列とは時間順に並んだ確率過程で、隣り合う時点の値が互いに相関しているのが特徴です。その『時間的な記憶』を数値化する道具が自己共分散 γk と自己相関 ρk で、ラグ k だけ離れた値どうしがどれだけ連動するかを測ります。定常な時系列は、この γk の並びによって『指紋』のように特徴づけられます。
AR(1) ϕ=0.8 の自己共分散 γk(緑・絶対スケール)と自己相関 ρk(赤・正規化)。γ0≈2.778 から指数減衰し、ρk=ϕk は −1〜1 に収まる。定常時系列を指紋のように特徴づける。
数式で表すと
γk=Cov(Yt,Yt−k)
時間順に並んだ確率過程。定常性・自己相関で構造を捉え、AR/MA でモデル化する。
時系列とは、時間 t の順に並んだ確率変数の列 {Yt}(確率過程)です。普通の独立標本と違い、近い時点どうしの値は相関をもつ——つまり『時間的な記憶』がある——のが本質で、その記憶の構造を捉えるのが時系列解析の出発点になります。
記憶を数値化する中心的な道具が自己共分散関数 γk です。ラグ k だけ離れた2時点の共分散として
γk=Cov(Yt,Yt−k)
と定義します。k=0 のときは γ0=Var(Yt) で、ただの分散になります。定常な時系列では γk が時点 t によらずラグ k だけで決まるので、γ0,γ1,γ2,… という数列がその過程を特徴づける『指紋』になります。
自己共分散はスケール依存なので、γ0 で割って正規化したものが自己相関関数 ρk です。
ρk=γ0γk
これは必ず −1≤ρk≤1 に収まり、ρ0=1 から始まります。ρk をラグごとに並べた図がコレログラム(ACF)で、時系列の記憶のパターンが一目で読み取れます。
この γk,ρk の減り方を見ると、AR と MA の『記憶の長さ』の違いがくっきり現れます。AR(自己回帰)は無限の記憶をもち、ρk は指数的に減衰するが完全には 0 になりません(AR(1) なら ρk=ϕk)。一方 MA(移動平均)は有限の記憶しかもたず、MA(q) では ρk がラグ q を超えるとぴたりと 0 に打ち切られます。つまり『尾を引けば AR、急に切れれば MA』で、自己相関の形がモデル選択の手がかりになります。
具体例として AR(1) で ϕ=0.8,σ2=1 とすると、γ0=1/(1−0.64)≈2.778、ρ1=0.8,ρ2=0.64=ϕ2 となって公式 ρk=ϕk を満たします。試験に出る性質
自己共分散関数
γk=Cov(Yt,Yt−k)。ラグ k 離れた値の共分散。k=0 では γ0=Var(Yt)。
自己相関関数
ρk=γk/γ0。γ0 で正規化したもので −1≤ρk≤1、ρ0=1。スケールに依存しない記憶の強さ。
定常なら指紋になる
定常時系列では γk が t によらずラグ k だけで決まる。数列 {γk} がその過程を特徴づける。
ARは無限の記憶(指数減衰)
AR は ρk が指数的に減衰するが完全には 0 にならない。AR(1) では ρk=ϕk で尾を引く。
MAは有限の記憶(打ち切り)
MA(q) は ρk がラグ q を超えるとぴたり 0。MA(1) はラグ2以降 0。尾を引けばAR・急に切れればMA。
例で見る
AR(1) で ϕ=0.8,σ2=1 とする。γ0=1/(1−ϕ2)=1/0.36≈2.778。
ρ1=0.8,ρ2=0.64=ϕ2 で公式 ρk=ϕk を満たす。
自己共分散は絶対スケール(≈2.778)、自己相関は −1〜1 に正規化されている対比。
つまずきポイント
- 自己共分散 γk と自己相関 ρk を混同する(γk はスケール依存、ρk=γk/γ0 は −1〜1 に正規化。ρ0 は必ず 1)
- 非定常な系列で γk がラグだけで決まると思う(γk が t によらないのは定常な場合。トレンドがあると t に依存する)
- ARとMAの記憶を取り違える(AR は指数減衰で尾を引く=無限の記憶、MA はラグ q で打ち切り=有限の記憶)
定着クイズ
自己共分散関数 γk の定義は?
自己相関 ρk と自己共分散 γk の関係は?
ARとMAの『記憶』の違いで正しいのは?