確率・用語
ひとことで言うと
「n個の標本を小さい順に並べ替えたときの、k番目の値」を表します。最小値も最大値も、この特別な場合(k=1またはk=n)です。
こんなデータが従う
n個の部品のうち最初に壊れる部品の寿命(最小値)n人の試験の最高点(最大値)ある期間の最高気温・最低気温保険金支払いの中で最も大きい1件の金額n個のサンプルの中央値
標本そのものではなく、「並べ替えた後の順番」に注目した統計量です。最大値・最小値・中央値はいずれも順序統計量の特別な場合です。
5個の標本X1〜X5(観測順、上段)を大きさの順に並べ替えると、最小値X(1)から最大値X(5)までの順序統計量になる(下段、両端を強調)。
数式で表すと
FX(n)(t)=F(t)n, FX(1)(t)=1−(1−F(t))n
記法は X(1)≤X(2)≤⋯≤X(n) で、丸括弧つきの添字が「小さい方から数えて何番目か」を表します(元の観測順を表す X1,…,Xn とは別物)。
最大値 X(n) がある値x以下になるのは、n個全部がx以下のときだけなので
P(X(n)≤x)=P(全てのXi≤x)=[F(x)]n
と、独立性から各 F(x) をn回掛けるだけで求まります。
最小値はこの逆を考えます。最小値がxより大きいのは、n個全部がxより大きいときだけなので
P(X(1)>x)=[1−F(x)]n、よって
P(X(1)≤x)=1−[1−F(x)]n
です。「以下」と「より大きい」の向きを反転させる点が、最大値の式との一番の違いです。試験に出る性質
最大値の分布
FX(n)(x)=[F(x)]n。
最小値の分布
FX(1)(x)=1−[1−F(x)]n。
一般のk番目の密度
f(k)(x)=(k−1)!(n−k)!n![F(x)]k−1[1−F(x)]n−kf(x)。
指数分布の最小値の特例
独立な Exp(λ) をn個とったときの最小値は Exp(nλ)(指数分布の最小値の競合と同じ事実)。
範囲(レンジ)
R=X(n)−X(1)(最大値と最小値の差)。
例で見る
独立に5個の U(0,1) をとったとき、最大値が0.9以下である確率は
P(X(5)≤0.9)=[F(0.9)]5=0.95≈0.590。
つまずきポイント
- 最小値の式に最大値の式 [F(x)]n をそのまま使ってしまう(最小値は 1−[1−F(x)]n)
- X(k)(k番目に小さい値)と元の Xk(k番目に観測した値)を混同する
- 独立性を使わずに P(全てがx以下) を確率の積に分解できない、と思い込む
定着クイズ
X(n)(最大値)の分布関数は?
X(1)(最小値)の分布関数は?
独立な Exp(λ) をn個とったときの最小値が従う分布は?