モデリング・用語
ひとことで言うと
現在の値が、直前の値に係数φを掛けたものに新しいランダムな変動(誤差項)を加えて決まる、時系列データの基本モデルです。
こんなデータが従う
保険の損害率や金利の時系列モデル株価リターンの時系列モデル季節性を除いた時系列データのモデリング経済指標(GDP成長率など)の時系列分析死亡率の時間的なトレンドのモデリング
時系列データの「前の値に引かれる」性質をモデル化する最も基本的な手法で、ARIMAなどより複雑なモデルの土台になります。
AR(1)過程の時系列。一定の平均の周りを変動し、|φ|<1ならいつかは平均に引き戻される。
数式で表すと
μ=1−ϕc, γ0=1−ϕ2σ2, ρk=ϕk
自己回帰モデル。AR(1) は Yt=c+ϕYt−1+εt。∣ϕ∣<1 で定常。
AR(1)(1次の自己回帰)モデルは Yt=c+ϕYt−1+εt という式で表され、現在の値Ytが直前の値Yt−1に係数φを掛けたものと定数c、そして独立なランダムな誤差項εtの合計で決まります。
このモデルが定常(concept: 定常性)であるためには ∣ϕ∣<1 が必要です。この条件のもとで、平均は μ=1−ϕc、分散は γ0=1−ϕ2σ2(σ²は誤差項の分散)、k期離れた自己相関は ρk=ϕk となります。φが1に近いほど自己相関が長く続き(値の変化がゆっくり)、φが0に近いほど各時点の値はほぼ独立に近い振る舞いをします。
|φ|≥1の場合は非定常(分散が時間とともに増大したり、ランダムウォーク(concept: ランダムウォーク)のように発散したりする)になり、AR(1)の標準的な公式(平均・分散・自己相関)は使えなくなります。試験に出る性質
モデルの式
Yt=c+ϕYt−1+εt。
平均
μ=c/(1−ϕ)。
分散
γ0=σ2/(1−ϕ2)。
自己相関
ρk=ϕk(k期離れた値との相関。φが1に近いほど減衰が遅い)。
例で見る
c=2, ϕ=0.5, σ2=4 のAR(1)過程の平均は μ=2/(1−0.5)=4、分散は γ0=4/(1−0.25)=16/3≈5.33。1期離れた自己相関は ρ1=0.5。
つまずきポイント
- |φ|<1の定常条件を確認せずに平均μ=c/(1-φ)の公式を使う(φ=1だと分母が0になり破綻する)
- 自己相関ρkをφ×kのように線形に減衰すると誤解する(正しくはφ^kの指数的な減衰)
- AR(1)の誤差項εtが各時点で独立であるという前提を忘れる
定着クイズ
AR(1)モデル Yt=c+φYt-1+εt が定常であるための条件は?
c=3, φ=0.4のAR(1)過程の平均μは?
AR(1)過程のk期離れた自己相関ρkは?