統計・用語
ひとことで言うと
非正則モデルとは、分布の『台(値を取りうる範囲)』が母数 θ に依存するなどの理由で、いつもの『対数尤度を微分してゼロ』という解法が使えないモデルです。一様分布 U(0,θ) が代表例で、MLEは微分ではなく『データを全部覆う最小の θ』=最大値 X(n) になります。
非正則モデル U(0,θ) の尤度 L(θ)=(1/θ)n(θ≥X(n))。θ<X(n) では尤度ゼロ、θ≥X(n) では単調減少。よって尤度は端 θ=X(n) で最大→θ^MLE=X(n)。微分=0は使えない。
数式で表すと
U(0,θ): θ^MLE=X(n)
分布のサポート(台)が母数に依存するなどで正則条件が崩れるモデル。U(0,θ) が典型。MLEは最大値統計量 X(n) となり、フィッシャー情報量に基づく漸近正規性・クラメール–ラオ下限が成り立たない。
非正則モデルとは、最尤法の正則条件が崩れるモデルの総称です。正則条件の中でも特に重要なのが『分布の台が母数 θ に依存しない』という条件で、これが破れると微分による標準的なMLE解法も、クラメール–ラオ下限も、漸近正規性も成り立たなくなります。典型例が一様分布 U(0,θ) で、密度は f(x;θ)=1/θ (0≤x≤θ)、台 [0,θ] の右端が θ そのものに依存しています。
U(0,θ) のMLEを求めてみます。尤度は各データが台に入る必要があるので
L(θ)=(θ1)n (θ≥X(n))
で、θ<X(n) では最大のデータが台の外になり尤度がゼロになります。θ≥X(n) の範囲では L(θ)=(1/θ)n が単調減少関数です。だから尤度を最大にするには、許される範囲でできるだけ小さい θ を選びたい——その最小値が最大値統計量 X(n) です。よって
θ^MLE=X(n)=max(X1,…,Xn)。
ここで決定的なのは、最大値は尤度の内点(微分ゼロ点)でなく許容範囲の端にあるという点です。だから ∂lnL/∂θ=0 という正則な手続きは使えません。
正則条件が崩れる帰結は3つあります。第一にフィッシャー情報量に基づく議論が無効になり、クラメール–ラオ下限が成り立ちません。第二に漸近正規性が崩れます——X(n) は正規分布ではなく、n(θ−X(n)) が指数分布に近づくといった別の極限分布をもちます。第三に収束が速い:X(n) の誤差は O(1/n) で正則な場合の O(1/n) より速く収束します。さらに X(n)≤θ なので下方バイアスをもちます(次の概念: バイアス補正 で補正します)。試験に出る性質
非正則の原因
分布の台が母数に依存する等で正則条件が崩れる。U(0,θ) は台 [0,θ] の右端が θ に依存する典型例。
MLEは最大値統計量
U(0,θ) では L(θ)=(1/θ)n(θ≥X(n))が単調減少。尤度は端で最大→θ^MLE=X(n)。
微分=0が使えない
最大値は尤度の内点でなく許容範囲の端。標準的な ∂lnL/∂θ=0 の解法は適用不能。
CR下限・漸近正規が崩れる
フィッシャー情報量に基づくCR下限も漸近正規性も成り立たない。極限分布は正規でなく指数型。
収束が速い・下方バイアス
誤差は O(1/n) で正則な O(1/n) より速い。X(n)≤θ なので下方バイアスをもつ。
例で見る
x=(0.3,0.7,0.4,0.9,0.6)、n=5 の U(0,θ) 標本。最大値 X(5)=0.9。
L(θ)=(1/θ)5(θ≥0.9)、θ<0.9 では尤度ゼロ。(1/θ)5 は減少関数なので最小の θ=0.9 で最大。
よって θ^MLE=0.9。真値を θ=1 とすると E[X(5)]=5/6≈0.833 で下方バイアスがある。
つまずきポイント
- 対数尤度を微分してゼロでMLEを求めようとする(U(0,θ) では尤度が単調で内部に極値がない。MLEは端 X(n) で、微分法は使えない)
- クラメール–ラオ下限や漸近正規性を当てはめる(正則条件が崩れているので無効。X(n) の極限分布は正規でなく指数型)
- X(n) をそのまま不偏と思う(X(n)≤θ で必ず下方にずれる。E[X(n)]=nθ/(n+1)<θ の下方バイアスがある)
定着クイズ
非正則モデルの典型 U(0,θ) のMLEは?
U(0,θ) でMLEを微分=0で求められない理由は?
非正則モデルで成り立たなくなるのは?