非正則モデル

統計・用語

ひとことで言うと

非正則モデルとは、分布の『台（値を取りうる範囲）』が母数 $\theta$ に依存するなどの理由で、いつもの『対数尤度を微分してゼロ』という解法が使えないモデルです。一様分布 $U(0,\theta)$ が代表例で、MLEは微分ではなく『データを全部覆う最小の $\theta$ 』＝最大値 $X_{(n)}$ になります。

非正則モデル $U(0,\theta)$ の尤度 $L(\theta)=(1/\theta)^n$ （ $\theta\ge X_{(n)}$ ）。 $\theta<X_{(n)}$ では尤度ゼロ、 $\theta\ge X_{(n)}$ では単調減少。よって尤度は端 $\theta=X_{(n)}$ で最大→ $\hat\theta_{\mathrm{MLE}}=X_{(n)}$ 。微分=0は使えない。

数式で表すと

$U(0,\theta):\ \hat\theta_{\mathrm{MLE}}=X_{(n)}$

分布のサポート（台）が母数に依存するなどで正則条件が崩れるモデル。 $U(0,\theta)$ が典型。MLEは最大値統計量 $X_{(n)}$ となり、フィッシャー情報量に基づく漸近正規性・クラメール–ラオ下限が成り立たない。

非正則モデルとは、最尤法の正則条件が崩れるモデルの総称です。正則条件の中でも特に重要なのが『分布の台が母数

\theta

に依存しない』という条件で、これが破れると微分による標準的なMLE解法も、クラメール–ラオ下限も、漸近正規性も成り立たなくなります。典型例が一様分布

U(0,\theta)

で、密度は

f(x;\theta)=1/\theta\ (0\le x\le\theta)

、台

[0,\theta]

の右端が

\theta

そのものに依存しています。

U(0,\theta)

のMLEを求めてみます。尤度は各データが台に入る必要があるので

L(\theta)=\Big(\frac{1}{\theta}\Big)^{n}\ \ (\theta\ge X_{(n)})

で、

\theta<X_{(n)}

では最大のデータが台の外になり尤度がゼロになります。

\theta\ge X_{(n)}

の範囲では

L(\theta)=(1/\theta)^n

が単調減少関数です。だから尤度を最大にするには、許される範囲でできるだけ小さい

\theta

を選びたい——その最小値が最大値統計量

X_{(n)}

です。よって

\hat\theta_{\mathrm{MLE}}=X_{(n)}=\max(X_1,\dots,X_n)

。ここで決定的なのは、最大値は尤度の内点（微分ゼロ点）でなく許容範囲の端にあるという点です。だから

\partial\ln L/\partial\theta=0

という正則な手続きは使えません。正則条件が崩れる帰結は3つあります。第一にフィッシャー情報量に基づく議論が無効になり、クラメール–ラオ下限が成り立ちません。第二に漸近正規性が崩れます——

X_{(n)}

は正規分布ではなく、

n(\theta-X_{(n)})

が指数分布に近づくといった別の極限分布をもちます。第三に収束が速い：

X_{(n)}

の誤差は

O(1/n)

で正則な場合の

O(1/\sqrt n)

より速く収束します。さらに

X_{(n)}\le\theta

なので下方バイアスをもちます（次の概念: バイアス補正で補正します）。

試験に出る性質

非正則の原因

分布の台が母数に依存する等で正則条件が崩れる。 $U(0,\theta)$ は台 $[0,\theta]$ の右端が $\theta$ に依存する典型例。

MLEは最大値統計量

$U(0,\theta)$ では $L(\theta)=(1/\theta)^n$ （ $\theta\ge X_{(n)}$ ）が単調減少。尤度は端で最大→ $\hat\theta_{\mathrm{MLE}}=X_{(n)}$ 。

微分=0が使えない

最大値は尤度の内点でなく許容範囲の端。標準的な $\partial\ln L/\partial\theta=0$ の解法は適用不能。

CR下限・漸近正規が崩れる

フィッシャー情報量に基づくCR下限も漸近正規性も成り立たない。極限分布は正規でなく指数型。

収束が速い・下方バイアス

誤差は $O(1/n)$ で正則な $O(1/\sqrt n)$ より速い。 $X_{(n)}\le\theta$ なので下方バイアスをもつ。

例で見る

$x=(0.3,0.7,0.4,0.9,0.6)$ 、 $n=5$ の $U(0,\theta)$ 標本。最大値 $X_{(5)}=0.9$ 。 $L(\theta)=(1/\theta)^5$ （ $\theta\ge0.9$ ）、 $\theta<0.9$ では尤度ゼロ。 $(1/\theta)^5$ は減少関数なので最小の $\theta=0.9$ で最大。よって $\hat\theta_{\mathrm{MLE}}=0.9$ 。真値を $\theta=1$ とすると $E[X_{(5)}]=5/6\approx0.833$ で下方バイアスがある。

つまずきポイント

対数尤度を微分してゼロでMLEを求めようとする（ $U(0,\theta)$ では尤度が単調で内部に極値がない。MLEは端 $X_{(n)}$ で、微分法は使えない）
クラメール–ラオ下限や漸近正規性を当てはめる（正則条件が崩れているので無効。 $X_{(n)}$ の極限分布は正規でなく指数型）
$X_{(n)}$ をそのまま不偏と思う（ $X_{(n)}\le\theta$ で必ず下方にずれる。 $E[X_{(n)}]=n\theta/(n+1)<\theta$ の下方バイアスがある）

定着クイズ

非正則モデルの典型 $U(0,\theta)$ のMLEは？

$U(0,\theta)$ でMLEを微分=0で求められない理由は？

非正則モデルで成り立たなくなるのは？

関連：#MLE #順序統計量 #一様分布 #有効性

この用語を扱う問題（1）

一様分布のMLE統計・★★★