acpass

確率用語

ひとことで言うと

競合とは、複数の独立な指数事象が『どれが最初に起きるか』を競う状況です。最小値が『最初の事象がいつ来るか(時刻)』を問うのに対し、競合は『どれが勝ったか(勝者の識別)』を問います。直感は『勢い(率)が大きい者ほど先に起きやすい』で、各者が勝つ確率はちょうど率に比例し、λi/jλj\lambda_i/\sum_j\lambda_j になります。

3者競合で各者が最初に発生する(勝つ)確率λi/Σλを積み上げた棒グラフ。λ1=0.1,λ2=0.2,λ3=0.3に対し確率は1/6≈0.167, 1/3≈0.333, 1/2=0.5で、合計すると1になる(必ずどれか1つが最初に起きる)。最小値が「いつ」を問うのに対し、競合は「どれが先か」という勝者の識別を問う勝つ確率 λi/Σλ。合計0.167+0.333+0.5=1(必ず誰かが先)λ1: 1/6≈0.167λ2: 1/3≈0.333λ3: 1/2=0.5合計=1確率

λ1=0.1,λ2=0.2,λ3=0.3\lambda_1=0.1,\lambda_2=0.2,\lambda_3=0.3 の3者競合で、各者が最初に発生する確率 λi/λj\lambda_i/\sum\lambda_j を積み上げた図。1/60.167, 1/30.333, 1/2=0.51/6\approx0.167,\ 1/3\approx0.333,\ 1/2=0.5 で合計1。必ずどれか1つが最初に起きる。

数式で表すと

P(X<Y)=λXλX+λYP(X<Y)=\dfrac{\lambda_X}{\lambda_X+\lambda_Y}

複数の独立指数事象が競うとき、最初に起こる確率は率に比例する。

競合(competing exponentials)は、独立な指数事象 X1,,XnX_1,\dots,X_nXiExp(λi)X_i\sim\mathrm{Exp}(\lambda_i))が並走するとき、『どの事象が最初に起きるか』を問う設定です。最小値(C024)が『最初の事象がいつ起きるか』=最小値の時刻の分布を扱ったのに対し、こちらは『どれが先に起きるか』=勝者の識別という、まったく別の問いを扱う点をまず押さえてください。 2変数の基本公式は P(X<Y)=λXλX+λYP(X<Y)=\dfrac{\lambda_X}{\lambda_X+\lambda_Y} です。導出は、X=xX=x で固定したとき Y>xY>x となる確率 eλYxe^{-\lambda_Y x}XX の密度 λXeλXx\lambda_X e^{-\lambda_X x} で重みづけ積分して、 P(X<Y)=0λXeλXxeλYxdx=λXλX+λYP(X<Y)=\int_0^\infty \lambda_X e^{-\lambda_X x}\,e^{-\lambda_Y x}\,dx=\dfrac{\lambda_X}{\lambda_X+\lambda_Y} となります。これを nn 変数へ一般化すると、成分 ii が最初に起きる確率は P(Xiが最小)=λijλjP(X_i\text{が最小})=\dfrac{\lambda_i}{\sum_j\lambda_j} です。要するに勝つ確率は率に比例し、率の総和で正規化したものになります。 重要な性質を3つ。第1に、勝つ確率の合計は iλi/jλj=1\sum_i\lambda_i/\sum_j\lambda_j=1 で、必ずどれか1つが最初に起きる(同時に2つ起きる確率は0)という検算が効きます。第2に、指数分布の特別な性質として、『どれが最初か(勝者)』と『最初の事象がいつか(最小値 Exp(λj)\mathrm{Exp}(\sum\lambda_j))』は独立です——勝者を知っても発生時刻の分布は変わりません。これは指数分布ならではで、ポアソン過程の解析を大きく簡単にします。第3に、これは間引き(C050)と表裏一体です。率 λj\sum\lambda_j のポアソン的な事象列を、起きた事象が『どの原因か』で確率 λi/λj\lambda_i/\sum\lambda_j に振り分けるのは、ポアソン過程を確率で間引いて各原因ごとの独立な過程に分ける操作にほかなりません。

試験に出る性質

問いの違い

最小値(C024)は『いつ最初の事象が起きるか』、競合は『どれが先に起きるか(勝者)』。同じ場面の別側面で、答えの式も異なる。

2変数の公式

P(X<Y)=λX/(λX+λY)P(X<Y)=\lambda_X/(\lambda_X+\lambda_Y)。率の大きい方が勝ちやすい。導出は 0λXeλXxeλYxdx\int_0^\infty\lambda_X e^{-\lambda_X x}e^{-\lambda_Y x}dx

n変数への一般化

P(Xiが最小)=λi/jλjP(X_i\text{が最小})=\lambda_i/\sum_j\lambda_j。勝つ確率は率に比例し、総和で正規化。合計すると1になる。

勝者と時刻は独立

『どれが勝つか』と『最小値がいつか Exp(λj)\mathrm{Exp}(\sum\lambda_j)』は独立(指数特有)。一方を知っても他方の分布は不変。

間引きとの関係

λj\sum\lambda_j の事象を確率 λi/λj\lambda_i/\sum\lambda_j で原因別に振り分けるのは、ポアソン過程の間引き(C050)と同じ構造。

例で見る

C024と同じ設定 λ1=0.1, λ2=0.2, λ3=0.3\lambda_1=0.1,\ \lambda_2=0.2,\ \lambda_3=0.3(和 =0.6=0.6)の3者競合。 各者が最初に『勝つ』確率:λ1/0.60.1667, λ2/0.60.3333, λ3/0.6=0.5\lambda_1/0.6\approx0.1667,\ \lambda_2/0.6\approx0.3333,\ \lambda_3/0.6=0.5。 合計 =0.1667+0.3333+0.5=1.0=0.1667+0.3333+0.5=1.0(必ずどれか1つが最初に起きるので確率の合計は1)。

つまずきポイント

  • 『どれが先か』と『いつ起きるか』を混同する(勝者の確率は λi/λj\lambda_i/\sum\lambda_j、最初の時刻は Exp(λj)\mathrm{Exp}(\sum\lambda_j)。別の問い・別の式)
  • 勝つ確率を率の逆数に比例させる(率が大きいほど先に起きやすい。確率は λi\lambda_i に比例し、1/λi1/\lambda_i ではない)
  • 勝者と発生時刻が従属だと思い込む(指数では両者は独立。勝者を知っても最小値の分布は Exp(λj)\mathrm{Exp}(\sum\lambda_j) のまま変わらない)

定着クイズ

独立な指数 X,YX,YP(X<Y)P(X<Y) は?

λ1=0.1,λ2=0.2,λ3=0.3\lambda_1=0.1,\lambda_2=0.2,\lambda_3=0.3 で成分3が最初に起きる確率は?

競合(どれが先か)と最小値(いつか)の関係は?

この用語を扱う問題(1