モデリング・用語
ひとことで言うと
差分は『隣の時点との差をとる』操作 ∇Yt=Yt−Yt−1 ですが、その正体はバックシフト演算子 B(1時点前を指す BYt=Yt−1)を使った ∇=1−B という代数演算です。多項式のように (1−B)2 と展開でき、2回差分や季節差分 (1−Bs) も同じ規則で機械的に書き下せます。
Y=(100,103,107,108,112) への差分。1回差分 ∇Y=(3,4,1,4)(緑)でトレンドが消えほぼ平坦。2回差分 ∇2Y=(1,−3,3)(赤)は変動がかえって大きく、1回で十分(過差分)と分かる。
数式で表すと
∇Yt=Yt−Yt−1
隣接時点の差をとる操作 ∇Yt=Yt−Yt−1。トレンドの除去・定常化に使う。
差分とは、隣り合う時点の差をとる操作で、1階差分は ∇Yt=Yt−Yt−1 と定義します。直感的には『水準』を捨てて『変化量』を見る操作で、トレンドの除去・定常化に使われます(概念: 定常化で扱う戦略の中核)。ここでは差分を代数的な演算として整理し、計算を機械化する道具立てを身につけます。
鍵になるのがバックシフト演算子(ラグ演算子)B です。B は系列を1時点だけ過去にずらす演算子で、BYt=Yt−1、B2Yt=Yt−2、BkYt=Yt−k と定義します。これを使うと1階差分は
∇Yt=Yt−Yt−1=Yt−BYt=(1−B)Yt
つまり ∇=1−B と演算子の引き算で書けます。∇ をあたかも (1−B) という多項式のように扱って展開・累乗できるのが強力なところです。たとえば2階差分は ∇ を2回かけるので
∇2Yt=(1−B)2Yt=(1−2B+B2)Yt=Yt−2Yt−1+Yt−2
と、二項展開の係数 1,−2,1 がそのまま出てきます。季節差分は周期 s だけ過去との差なので
∇sYt=(1−Bs)Yt=Yt−Yt−s
と書けます(月次データの年差分なら s=12)。∇2 と ∇s は別物で、前者は『差分を2回』、後者は『1回だけ s 離れた差分』である点に注意してください。
演算子の言葉は ARIMA モデルの表現にも直結します。AR・MA・差分すべて B の多項式の積で書けるため、モデル全体がコンパクトに表せます。具体例:Y=(100,103,107,108,112) のとき1階差分は (3,4,1,4) でトレンドが消えほぼ平坦。2階差分は (1,−3,3) で変動がかえって大きくなる——1回差分で十分だったこと(過差分)が見て取れます。試験に出る性質
1階差分の定義
∇Yt=Yt−Yt−1。水準を捨て変化量を見る。トレンド除去・定常化の基本操作。
バックシフト演算子
BYt=Yt−1、BkYt=Yt−k。∇=1−B と演算子で書け、多項式のように扱える。
2階差分
∇2Yt=(1−B)2Yt=Yt−2Yt−1+Yt−2。二項展開で係数 1,−2,1。
季節差分
∇sYt=(1−Bs)Yt=Yt−Yt−s。周期 s だけ前との差。∇2 とは別物。
ARIMA表現に直結
AR・MA・差分すべて B の多項式の積で書ける。(1−B)d などコンパクトに表現できる。
例で見る
Y=(100,103,107,108,112)。1階差分 ∇Y=(3,4,1,4)(トレンドが消えほぼ平坦)。
2階差分 ∇2Y=(4−3, 1−4, 4−1)=(1,−3,3)(変動がかえって大きく過差分)。
バックシフト確認: (1−B)Y5=Y5−Y4=112−108=4 で1階差分の最後の値に一致。
つまずきポイント
- 2階差分 ∇2 と季節差分 ∇s を混同する(∇2=(1−B)2 は差分を2回、∇s=1−Bs は1回だけ s 時点離れた差)
- ∇2Yt の係数を間違える((1−B)2=1−2B+B2 で Yt−2Yt−1+Yt−2。Yt−Yt−2 ではない)
- 差分でデータ点が減ることを忘れる(n 点を1階差分すると n−1 点、2階差分で n−2 点になる)
定着クイズ
バックシフト演算子 B を使った1階差分の表現は?
2階差分 ∇2Yt=(1−B)2Yt を展開すると?
Y=(100,103,107,108,112) の1階差分は?