acpass

確率公式

ひとことで言うと

独立な指数分布たちの最小値は、また指数分布になり、その率(レート)は各率の単純な足し算 λi\sum\lambda_i です。直感は『どれか1つでも先に起きればいい』ので、瞬間的に起きる勢い(ハザード)が全員ぶん足し合わさる、というもの。複数の部品のうち最初に壊れるもの、複数の原因のうち最初に来るクレーム、といった『最初の事象』のモデルです。

3つの独立な指数分布の生存曲線exp(-λt)(灰破線、λ1=0.1,λ2=0.2,λ3=0.3)と、その最小値の生存曲線exp(-0.6t)(緑)を重ねた図。最小値の生存確率は3つの生存確率の積で、率がΣλ=0.6の指数分布Exp(0.6)になる。瞬間故障率(ハザード)が加法的に足し合わさることを表す最小値の生存=積→Exp(Σλ)=Exp(0.6)。ハザードが加法的min~Exp(0.6)各成分λi生存P(min>t)t

3つの独立な指数分布の生存曲線 eλte^{-\lambda t}(灰破線、λ=0.1,0.2,0.3\lambda=0.1,0.2,0.3)と、その最小値の生存曲線 e0.6te^{-0.6t}(緑)。最小値の生存確率は各生存確率の積で、率は和 λi=0.6\sum\lambda_i=0.6Exp(0.6)\mathrm{Exp}(0.6) になる。

数式で表すと

minExp(iλi)\min\sim\mathrm{Exp}\big(\textstyle\sum_i\lambda_i\big)

nn 個の独立指数の最小値は指数分布で、率はパラメータの和。

最小値 X(1)=min(X1,,Xn)X_{(1)}=\min(X_1,\dots,X_n) について、各 XiX_i が独立な指数分布 Exp(λi)\mathrm{Exp}(\lambda_i) のとき、最小値はまた指数分布になり、その率は各率の和 iλi\sum_i\lambda_i になります:minExp(iλi)\min\sim\mathrm{Exp}(\sum_i\lambda_i)。順序統計量では『同じ λ\lambdann 個取ると Exp(nλ)\mathrm{Exp}(n\lambda)』という特例に軽く触れていますが、ここでは率が全部違う λ1,,λn\lambda_1,\dots,\lambda_n の一般の場合へ広げ、『なぜ和になるのか』を2つの角度から説明します。 第1の角度は生存関数の積です。最小値が tt を超える    \iff全員が tt を超える、なので独立性から P(min>t)=iP(Xi>t)=ieλit=e(iλi)tP(\min>t)=\prod_i P(X_i>t)=\prod_i e^{-\lambda_i t}=e^{-(\sum_i\lambda_i)t} となり、これは率 iλi\sum_i\lambda_i の指数分布の生存関数そのものです。指数の肩で率がそのまま足し算になる点が本質です。 第2の角度がハザードの加法性で、こちらが直感の核心です。指数分布の瞬間故障率(ハザード率)は一定値 λi\lambda_i で、『今この瞬間の微小時間 dtdt に成分 ii が初めて故障する確率』は近似的に λidt\lambda_i\,dt です。最小値=『どれか1つでも故障する最初の時刻』なので、微小時間 dtdt に少なくとも1つが故障する確率は、独立なら各成分の故障確率の和 iλidt\sum_i\lambda_i\,dt(同時に2つ起きる確率は dtdt の高次で無視できる)。つまり最小値のハザード率が iλi\sum_i\lambda_i となり、ハザード一定の指数分布の定義から minExp(iλi)\min\sim\mathrm{Exp}(\sum_i\lambda_i) が出ます。実務では、複数の独立な故障原因や保険クレーム発生原因が並走するとき、『最初の事故が起きるまでの時間』を率の合計で一気に評価できます(期待値は 1/iλi1/\sum_i\lambda_i)。なお『どの成分が最初に壊れたか』という別の問いは競合(C025)で扱います。

試験に出る性質

率は和になる

独立な Exp(λi)\mathrm{Exp}(\lambda_i) の最小値は Exp(iλi)\mathrm{Exp}(\sum_i\lambda_i)。率が違っても成立する一般則。期待値は 1/iλi1/\sum_i\lambda_i

生存関数の積

P(min>t)=ieλit=e(λi)tP(\min>t)=\prod_i e^{-\lambda_i t}=e^{-(\sum\lambda_i)t}。指数の肩で率が足し算になるのが本質。

ハザードの加法性

指数のハザードは一定 λi\lambda_i。微小時間 dtdt に『どれか故障』する確率は iλidt\sum_i\lambda_i\,dt で、最小値のハザード率が iλi\sum_i\lambda_i になる。

無記憶性の継承

指数の無記憶性ゆえ、すでに ss 経過しても最小値の残り時間は同じ Exp(λi)\mathrm{Exp}(\sum\lambda_i)。経過時間に依存しない。

『いつ』を問う

最小値は『最初の事象がいつ起きるか』の分布。一方『どれが先か』の識別は競合(C025)の問いで、別の式になる。

例で見る

3つの独立な指数分布(故障時間や保険クレーム発生時間など)λ1=0.1, λ2=0.2, λ3=0.3\lambda_1=0.1,\ \lambda_2=0.2,\ \lambda_3=0.3。 最小値 Exp(0.1+0.2+0.3)=Exp(0.6)\sim\mathrm{Exp}(0.1+0.2+0.3)=\mathrm{Exp}(0.6)。期待値 E[min]=1/0.61.667E[\min]=1/0.6\approx1.667。 『成分1が最初に故障する確率』は λ1/(λ1+λ2+λ3)=0.1/0.60.1667\lambda_1/(\lambda_1+\lambda_2+\lambda_3)=0.1/0.6\approx0.1667(この値は競合C025の例で再利用)。

つまずきポイント

  • 率を平均してしまう(最小値の率は和 λi\sum\lambda_i であって平均ではない。期待値は 1/λi1/\sum\lambda_i で、各期待値の最小ではない)
  • 最大値と同じ要領で扱う(最小は生存関数の積 eλit\prod e^{-\lambda_i t}。最大値 F(t)nF(t)^n の発想をそのまま当てると逆になる)
  • 『最小値がいつか』と『どれが最初か』を混同する(前者は最小値の分布 Exp(Σλ)、後者は競合 λi/λj\lambda_i/\sum\lambda_j で別問題)

定着クイズ

独立な Exp(λi)\mathrm{Exp}(\lambda_i) たちの最小値の分布は?

最小値の率が λi\sum\lambda_i になる直感は?

λ1=0.1,λ2=0.2,λ3=0.3\lambda_1=0.1,\lambda_2=0.2,\lambda_3=0.3 の最小値の期待値は?

この用語を扱う問題(2

最小値とは|定義・公式とアクチュアリー試験の関連問題 | acpass