acpass

負の二項分布

知識マップ

確率用語

ひとことで言うと

「成功か失敗かの試行を繰り返したとき、rr 回目の成功が出そろうまでに何回の試行がかかるか」を表す離散分布です。幾何分布が『初めての成功まで』だったのを、『rr 回目の成功まで』に一般化したものです。

こんなデータが従う

3人目の契約者が成約するまでの営業件数5個目の不良品が見つかるまでに検査した製品数3回当たりを引くまでに買ったくじの枚数2回目のサーバ障害が起きるまでのリクエスト数目標の成功回数に達するまでの試行回数

「成功確率 pp が一定のベルヌーイ試行を、rr 回成功するまで独立に繰り返す」状況で現れます。同じ pp の幾何分布を独立に rr 個足したものと同じで、r=1r=1 のときちょうど幾何分布になります。

負の二項分布の確率関数(r=3, p=0.4)。幾何分布よりも右にずれた山型で、r回の成功が出そろうまでの試行回数の分布幾何分布r個ぶんの和なので、山が右へずれて広がる3579111315平均 r/pk(r回成功までの試行回数)P(X=k)

横軸は rr 回成功までの試行回数 kk、縦軸は確率 P(X=k)P(X=k)。幾何分布(初成功まで)の山を rr 個ぶん足し合わせた形で、山が右にずれ、左右に広がる。平均は r/pr/p

数式で表すと

E[X]=r/p, Var=r(1p)/p2E[X]=r/p,\ \mathrm{Var}=r(1-p)/p^2

rr 回成功するまでの試行回数の分布。同一 pp の幾何分布 rr 個の和。

acpassでは幾何分布と整合させ、「rr 回目の成功までの試行回数」を XX とする版を基本とします。XXr,r+1,r+2,r,r+1,r+2,\dots の値を取り、 P(X=k)=(k1r1)pr(1p)kr(kr)P(X=k)=\binom{k-1}{r-1}p^r(1-p)^{k-r}\quad(k\ge r) と書けます。意味は「kk 回目で rr 個目の成功を出す」ためには、k1k-1 回目までに r1r-1 個の成功が散らばっており((k1r1)\binom{k-1}{r-1} 通り)、合計 rr 個の成功(prp^r)と krk-r 個の失敗((1p)kr(1-p)^{k-r})が起きる、という積です。 平均と分散は E[X]=rp,Var(X)=r(1p)p2E[X]=\dfrac{r}{p},\quad \mathrm{Var}(X)=\dfrac{r(1-p)}{p^2} です。これは「初成功までの幾何分布(平均 1/p1/p、分散 (1p)/p2(1-p)/p^2)」を独立に rr 個足したものとして自然に理解できます。独立な和なので、平均も分散もそれぞれ rr 倍になっているわけです。r=1r=1 を代入すると平均 1/p1/p・分散 (1p)/p2(1-p)/p^2 となり、ちょうど幾何分布に一致します。 なお負の二項分布には「rr 回成功までの“失敗回数” Y=XrY=X-r」を変数にとる流儀もあり、その場合 P(Y=j)=(r+j1j)pr(1p)j (j=0,1,2,)P(Y=j)=\binom{r+j-1}{j}p^r(1-p)^j\ (j=0,1,2,\dots)E[Y]=r(1p)/pE[Y]=r(1-p)/p となって平均が rr だけずれます。問題文がどちらの定義かを必ず確認してください。

試験に出る性質

確率関数と平均・分散

P(X=k)=(k1r1)pr(1p)krP(X=k)=\binom{k-1}{r-1}p^r(1-p)^{k-r}E[X]=r/pE[X]=r/pVar(X)=r(1p)/p2\mathrm{Var}(X)=r(1-p)/p^2

幾何分布の和

同じ pp の独立な幾何分布を rr 個足したものと同じ。だから平均・分散がともに rr 倍になる。

r=1で幾何分布

r=1r=1 を代入すると平均 1/p1/p・分散 (1p)/p2(1-p)/p^2 となり、ちょうど幾何分布に一致する。

r についての再生性

独立な NB(r1,p)\mathrm{NB}(r_1,p)NB(r2,p)\mathrm{NB}(r_2,p)(同じ pp)の和は NB(r1+r2,p)\mathrm{NB}(r_1+r_2,p) になる。

二項分布との役割の違い

二項分布は『試行回数 nn を固定して成功回数を数える』。負の二項は『成功回数 rr を固定して試行回数を数える』、いわば二項の裏返し。

例で見る

サイコロで6を r=3r=3 回出すまでに振る回数(p=1/6p=1/6)。ちょうど10回目で3回目の6が出る確率は P(X=10)=(92)(1/6)3(5/6)70.046P(X=10)=\binom{9}{2}(1/6)^3(5/6)^7\approx0.046。 3回目の6が出るまでの平均回数は E[X]=r/p=3×6=18E[X]=r/p=3\times6=18 回。

つまずきポイント

  • 「試行回数版」X{r,r+1,}X\in\{r,r+1,\dots\}E[X]=r/pE[X]=r/p)と「失敗回数版」Y=Xr{0,1,}Y=X-r\in\{0,1,\dots\}E[Y]=r(1p)/pE[Y]=r(1-p)/p)を混同し、平均を取り違える
  • 二項係数を (kr)\binom{k}{r} と書く(kk 回目で rr 個目を確定させるので、直前 k1k-1 回に r1r-1 個=(k1r1)\binom{k-1}{r-1} が正しい)
  • 二項分布(試行回数を固定)と負の二項分布(成功回数を固定)の『何を固定するか』を取り違える

定着クイズ

負の二項分布(試行回数版・rr 回成功まで)の平均 E[X]E[X] は?

負の二項分布が幾何分布に一致するのは rr がいくつのとき?

負の二項分布(試行回数版)の確率関数 P(X=k)P(X=k) の二項係数は?

この用語を扱う問題(3