ベルヌーイ

確率・用語

ひとことで言うと

「成功か失敗か、1か0か」の1回きりの試行を表す、最も単純な確率変数です。コインを1回投げて表が出れば1・裏なら0、といった“1試行ぶん”の成功/失敗を数値で表します。

コインを1回投げて表が出るか1人の契約者がその年に事故を起こすか1個の製品が不良かどうか1回のくじが当たりかはずれか1問のテストに正解するか

「結果が成功/失敗の2通りしかない1回の試行」はすべてベルヌーイ分布です。これを独立に n 回繰り返して成功回数を数えたものが二項分布になります（ベルヌーイは二項分布の n=1 の場合）。

横軸は値 $k$ （成功=1 / 失敗=0）、縦軸は確率 $P(X=k)$ 。値1が確率 $p$ 、値0が確率 $1-p$ の2本だけ。p が大きいほど右の棒が高くなる。

$E[X]=p,\ \mathrm{Var}=p(1-p)$

成功=1・失敗=0 の最小の確率変数。二項分布の1試行。

記法は成功確率

p

をパラメータにとり、確率変数

X

が1（成功）か0（失敗）のどちらかの値だけを取ります。

P(X=1)=p,\ P(X=0)=1-p

この「失敗を0、成功を1」と数値化する約束が効いていて、平均がそのまま成功確率になります。実際

E[X]=1\cdot p+0\cdot(1-p)=p

。分散は

E[X^2]=1^2\cdot p+0^2\cdot(1-p)=p

なので、

\mathrm{Var}(X)=E[X^2]-(E[X])^2=p-p^2=p(1-p)

となります。分散が

p(1-p)

なので、

p=0.5

のとき最大（最も予測しにくい）、

p

が0や1に近いほど小さく（ほぼ確実）なります。ベルヌーイ分布は単体で出るより、より複雑な分布の“部品”として現れます。独立なベルヌーイをn個足せば二項分布、初めて成功するまでの回数を数えれば幾何分布、というように、多くの離散分布の出発点です。

平均と分散

$E[X]=p,\ \mathrm{Var}(X)=p(1-p)$ 。平均が成功確率そのものになる。

分散が最大になる点

$p(1-p)$ は $p=0.5$ で最大。五分五分のとき最もばらつく。

二項分布との関係

独立なベルヌーイ $n$ 個の和が $B(n,p)$ 。ベルヌーイは二項分布の $n=1$ の場合。

指示変数（indicator）

「事象Aが起きたら1」とする指示変数はベルヌーイ。 $E[\mathbf{1}_A]=P(A)$ が成り立つ。

幾何・負の二項の素材

ベルヌーイ試行を繰り返したときの初成功までの回数が幾何分布、 $r$ 回成功までが負の二項分布。

成功確率 $p=0.3$ のベルヌーイ試行の平均と分散は $E[X]=0.3$ 、 $\mathrm{Var}(X)=0.3\times0.7=0.21$ 。標準偏差は $\sqrt{0.21}\approx0.458$ 。

ベルヌーイ分布 $X$ （成功確率 $p$ ）の分散は？

ベルヌーイ分布の分散 $p(1-p)$ が最大になる $p$ は？

ベルヌーイ分布を独立にn個足し合わせると何分布になる？