順序統計量

確率・用語

ひとことで言うと

「n個の標本を小さい順に並べ替えたときの、k番目の値」を表します。最小値も最大値も、この特別な場合（k=1またはk=n）です。

n個の部品のうち最初に壊れる部品の寿命（最小値）n人の試験の最高点（最大値）ある期間の最高気温・最低気温保険金支払いの中で最も大きい1件の金額n個のサンプルの中央値

標本そのものではなく、「並べ替えた後の順番」に注目した統計量です。最大値・最小値・中央値はいずれも順序統計量の特別な場合です。

5個の標本X1〜X5（観測順、上段）を大きさの順に並べ替えると、最小値X(1)から最大値X(5)までの順序統計量になる（下段、両端を強調）。

$F_{X_{(n)}}(t)=F(t)^n,\ F_{X_{(1)}}(t)=1-(1-F(t))^n$

記法は

X_{(1)}\le X_{(2)}\le\dots\le X_{(n)}

で、丸括弧つきの添字が「小さい方から数えて何番目か」を表します（元の観測順を表す

X_1,\dots,X_n

とは別物）。最大値

X_{(n)}

がある値x以下になるのは、n個全部がx以下のときだけなので

P(X_{(n)}\le x)=P(\text{全てのX}_i\le x)=[F(x)]^n

と、独立性から各

F(x)

をn回掛けるだけで求まります。最小値はこの逆を考えます。最小値がxより大きいのは、n個全部がxより大きいときだけなので

P(X_{(1)}>x)=[1-F(x)]^n

、よって

P(X_{(1)}\le x)=1-[1-F(x)]^n

です。「以下」と「より大きい」の向きを反転させる点が、最大値の式との一番の違いです。

最大値の分布

$F_{X_{(n)}}(x)=[F(x)]^n$ 。

最小値の分布

$F_{X_{(1)}}(x)=1-[1-F(x)]^n$ 。

一般のk番目の密度

$f_{(k)}(x)=\dfrac{n!}{(k-1)!(n-k)!}[F(x)]^{k-1}[1-F(x)]^{n-k}f(x)$ 。

指数分布の最小値の特例

独立な $Exp(\lambda)$ をn個とったときの最小値は $Exp(n\lambda)$ （指数分布の最小値の競合と同じ事実）。

範囲（レンジ）

$R=X_{(n)}-X_{(1)}$ （最大値と最小値の差）。

独立に5個の $U(0,1)$ をとったとき、最大値が0.9以下である確率は $P(X_{(5)}\le 0.9)=[F(0.9)]^5=0.9^5\approx 0.590$ 。

$X_{(n)}$ （最大値）の分布関数は？

$X_{(1)}$ （最小値）の分布関数は？

独立な $Exp(\lambda)$ をn個とったときの最小値が従う分布は？

この用語を扱う問題（8）