acpass

順序統計量

知識マップ

確率用語

ひとことで言うと

「n個の標本を小さい順に並べ替えたときの、k番目の値」を表します。最小値も最大値も、この特別な場合(k=1またはk=n)です。

こんなデータが従う

n個の部品のうち最初に壊れる部品の寿命(最小値)n人の試験の最高点(最大値)ある期間の最高気温・最低気温保険金支払いの中で最も大きい1件の金額n個のサンプルの中央値

標本そのものではなく、「並べ替えた後の順番」に注目した統計量です。最大値・最小値・中央値はいずれも順序統計量の特別な場合です。

n個の標本を並べ替えると順序統計量X(1)以下…以下X(n)になる(最小値と最大値を強調)X3X1X5X2X4X(1)X(2)X(3)X(4)X(5)観測順大きさの順

5個の標本X1〜X5(観測順、上段)を大きさの順に並べ替えると、最小値X(1)から最大値X(5)までの順序統計量になる(下段、両端を強調)。

数式で表すと

FX(n)(t)=F(t)n, FX(1)(t)=1(1F(t))nF_{X_{(n)}}(t)=F(t)^n,\ F_{X_{(1)}}(t)=1-(1-F(t))^n

記法は X(1)X(2)X(n)X_{(1)}\le X_{(2)}\le\dots\le X_{(n)} で、丸括弧つきの添字が「小さい方から数えて何番目か」を表します(元の観測順を表す X1,,XnX_1,\dots,X_n とは別物)。 最大値 X(n)X_{(n)} がある値x以下になるのは、n個全部がx以下のときだけなので P(X(n)x)=P(全てのXix)=[F(x)]nP(X_{(n)}\le x)=P(\text{全てのX}_i\le x)=[F(x)]^n と、独立性から各 F(x)F(x) をn回掛けるだけで求まります。 最小値はこの逆を考えます。最小値がxより大きいのは、n個全部がxより大きいときだけなので P(X(1)>x)=[1F(x)]nP(X_{(1)}>x)=[1-F(x)]^n、よって P(X(1)x)=1[1F(x)]nP(X_{(1)}\le x)=1-[1-F(x)]^n です。「以下」と「より大きい」の向きを反転させる点が、最大値の式との一番の違いです。

試験に出る性質

最大値の分布

FX(n)(x)=[F(x)]nF_{X_{(n)}}(x)=[F(x)]^n

最小値の分布

FX(1)(x)=1[1F(x)]nF_{X_{(1)}}(x)=1-[1-F(x)]^n

一般のk番目の密度

f(k)(x)=n!(k1)!(nk)![F(x)]k1[1F(x)]nkf(x)f_{(k)}(x)=\dfrac{n!}{(k-1)!(n-k)!}[F(x)]^{k-1}[1-F(x)]^{n-k}f(x)

指数分布の最小値の特例

独立な Exp(λ)Exp(\lambda) をn個とったときの最小値は Exp(nλ)Exp(n\lambda)(指数分布の最小値の競合と同じ事実)。

範囲(レンジ)

R=X(n)X(1)R=X_{(n)}-X_{(1)}(最大値と最小値の差)。

例で見る

独立に5個の U(0,1)U(0,1) をとったとき、最大値が0.9以下である確率は P(X(5)0.9)=[F(0.9)]5=0.950.590P(X_{(5)}\le 0.9)=[F(0.9)]^5=0.9^5\approx 0.590

つまずきポイント

  • 最小値の式に最大値の式 [F(x)]n[F(x)]^n をそのまま使ってしまう(最小値は 1[1F(x)]n1-[1-F(x)]^n
  • X(k)X_{(k)}(k番目に小さい値)と元の XkX_k(k番目に観測した値)を混同する
  • 独立性を使わずに P(全てがx以下)P(\text{全てがx以下}) を確率の積に分解できない、と思い込む

定着クイズ

X(n)X_{(n)}(最大値)の分布関数は?

X(1)X_{(1)}(最小値)の分布関数は?

独立な Exp(λ)Exp(\lambda) をn個とったときの最小値が従う分布は?

この用語を扱う問題(8