確率・公式
ひとことで言うと
独立な指数分布たちの最小値は、また指数分布になり、その率(レート)は各率の単純な足し算 ∑λi です。直感は『どれか1つでも先に起きればいい』ので、瞬間的に起きる勢い(ハザード)が全員ぶん足し合わさる、というもの。複数の部品のうち最初に壊れるもの、複数の原因のうち最初に来るクレーム、といった『最初の事象』のモデルです。
3つの独立な指数分布の生存曲線 e−λt(灰破線、λ=0.1,0.2,0.3)と、その最小値の生存曲線 e−0.6t(緑)。最小値の生存確率は各生存確率の積で、率は和 ∑λi=0.6 の Exp(0.6) になる。
数式で表すと
min∼Exp(∑iλi)
n 個の独立指数の最小値は指数分布で、率はパラメータの和。
最小値 X(1)=min(X1,…,Xn) について、各 Xi が独立な指数分布 Exp(λi) のとき、最小値はまた指数分布になり、その率は各率の和 ∑iλi になります:min∼Exp(∑iλi)。順序統計量では『同じ λ を n 個取ると Exp(nλ)』という特例に軽く触れていますが、ここでは率が全部違う λ1,…,λn の一般の場合へ広げ、『なぜ和になるのか』を2つの角度から説明します。
第1の角度は生存関数の積です。最小値が t を超える⟺全員が t を超える、なので独立性から
P(min>t)=∏iP(Xi>t)=∏ie−λit=e−(∑iλi)t
となり、これは率 ∑iλi の指数分布の生存関数そのものです。指数の肩で率がそのまま足し算になる点が本質です。
第2の角度がハザードの加法性で、こちらが直感の核心です。指数分布の瞬間故障率(ハザード率)は一定値 λi で、『今この瞬間の微小時間 dt に成分 i が初めて故障する確率』は近似的に λidt です。最小値=『どれか1つでも故障する最初の時刻』なので、微小時間 dt に少なくとも1つが故障する確率は、独立なら各成分の故障確率の和 ∑iλidt(同時に2つ起きる確率は dt の高次で無視できる)。つまり最小値のハザード率が ∑iλi となり、ハザード一定の指数分布の定義から min∼Exp(∑iλi) が出ます。実務では、複数の独立な故障原因や保険クレーム発生原因が並走するとき、『最初の事故が起きるまでの時間』を率の合計で一気に評価できます(期待値は 1/∑iλi)。なお『どの成分が最初に壊れたか』という別の問いは競合(C025)で扱います。試験に出る性質
率は和になる
独立な Exp(λi) の最小値は Exp(∑iλi)。率が違っても成立する一般則。期待値は 1/∑iλi。
生存関数の積
P(min>t)=∏ie−λit=e−(∑λi)t。指数の肩で率が足し算になるのが本質。
ハザードの加法性
指数のハザードは一定 λi。微小時間 dt に『どれか故障』する確率は ∑iλidt で、最小値のハザード率が ∑iλi になる。
無記憶性の継承
指数の無記憶性ゆえ、すでに s 経過しても最小値の残り時間は同じ Exp(∑λi)。経過時間に依存しない。
『いつ』を問う
最小値は『最初の事象がいつ起きるか』の分布。一方『どれが先か』の識別は競合(C025)の問いで、別の式になる。
例で見る
3つの独立な指数分布(故障時間や保険クレーム発生時間など)λ1=0.1, λ2=0.2, λ3=0.3。
最小値 ∼Exp(0.1+0.2+0.3)=Exp(0.6)。期待値 E[min]=1/0.6≈1.667。
『成分1が最初に故障する確率』は λ1/(λ1+λ2+λ3)=0.1/0.6≈0.1667(この値は競合C025の例で再利用)。
つまずきポイント
- 率を平均してしまう(最小値の率は和 ∑λi であって平均ではない。期待値は 1/∑λi で、各期待値の最小ではない)
- 最大値と同じ要領で扱う(最小は生存関数の積 ∏e−λit。最大値 F(t)n の発想をそのまま当てると逆になる)
- 『最小値がいつか』と『どれが最初か』を混同する(前者は最小値の分布 Exp(Σλ)、後者は競合 λi/∑λj で別問題)
定着クイズ
独立な Exp(λi) たちの最小値の分布は?
最小値の率が ∑λi になる直感は?
λ1=0.1,λ2=0.2,λ3=0.3 の最小値の期待値は?