acpass

ベルヌーイ

知識マップ

確率用語

ひとことで言うと

「成功か失敗か、1か0か」の1回きりの試行を表す、最も単純な確率変数です。コインを1回投げて表が出れば1・裏なら0、といった“1試行ぶん”の成功/失敗を数値で表します。

こんなデータが従う

コインを1回投げて表が出るか1人の契約者がその年に事故を起こすか1個の製品が不良かどうか1回のくじが当たりかはずれか1問のテストに正解するか

「結果が成功/失敗の2通りしかない1回の試行」はすべてベルヌーイ分布です。これを独立に n 回繰り返して成功回数を数えたものが二項分布になります(ベルヌーイは二項分布の n=1 の場合)。

ベルヌーイ分布の確率関数。値1(成功)が確率p、値0(失敗)が確率1−pの2本だけの棒取りうる値は0か1の2つだけ(二項分布のn=1版)0(失敗)1−p1(成功)pk(成功=1/失敗=0)P(X=k)

横軸は値 kk(成功=1 / 失敗=0)、縦軸は確率 P(X=k)P(X=k)。値1が確率 pp、値0が確率 1p1-p の2本だけ。p が大きいほど右の棒が高くなる。

数式で表すと

E[X]=p, Var=p(1p)E[X]=p,\ \mathrm{Var}=p(1-p)

成功=1・失敗=0 の最小の確率変数。二項分布の1試行。

記法は成功確率 pp をパラメータにとり、確率変数 XX が1(成功)か0(失敗)のどちらかの値だけを取ります。 P(X=1)=p, P(X=0)=1pP(X=1)=p,\ P(X=0)=1-p この「失敗を0、成功を1」と数値化する約束が効いていて、平均がそのまま成功確率になります。 実際 E[X]=1p+0(1p)=pE[X]=1\cdot p+0\cdot(1-p)=p。分散は E[X2]=12p+02(1p)=pE[X^2]=1^2\cdot p+0^2\cdot(1-p)=p なので、 Var(X)=E[X2](E[X])2=pp2=p(1p)\mathrm{Var}(X)=E[X^2]-(E[X])^2=p-p^2=p(1-p) となります。分散が p(1p)p(1-p) なので、p=0.5p=0.5 のとき最大(最も予測しにくい)、pp が0や1に近いほど小さく(ほぼ確実)なります。 ベルヌーイ分布は単体で出るより、より複雑な分布の“部品”として現れます。独立なベルヌーイをn個足せば二項分布、初めて成功するまでの回数を数えれば幾何分布、というように、多くの離散分布の出発点です。

試験に出る性質

平均と分散

E[X]=p, Var(X)=p(1p)E[X]=p,\ \mathrm{Var}(X)=p(1-p)。平均が成功確率そのものになる。

分散が最大になる点

p(1p)p(1-p)p=0.5p=0.5 で最大。五分五分のとき最もばらつく。

二項分布との関係

独立なベルヌーイ nn 個の和が B(n,p)B(n,p)。ベルヌーイは二項分布の n=1n=1 の場合。

指示変数(indicator)

「事象Aが起きたら1」とする指示変数はベルヌーイ。E[1A]=P(A)E[\mathbf{1}_A]=P(A) が成り立つ。

幾何・負の二項の素材

ベルヌーイ試行を繰り返したときの初成功までの回数が幾何分布、rr 回成功までが負の二項分布。

例で見る

成功確率 p=0.3p=0.3 のベルヌーイ試行の平均と分散は E[X]=0.3E[X]=0.3Var(X)=0.3×0.7=0.21\mathrm{Var}(X)=0.3\times0.7=0.21。 標準偏差は 0.210.458\sqrt{0.21}\approx0.458

つまずきポイント

  • 分散を pp と書いてしまう(E[X2]=pE[X^2]=p は正しいが、分散は pp2=p(1p)p-p^2=p(1-p)
  • 成功を0・失敗を1と逆に割り当てると平均が pp にならない(成功=1の約束を守る)
  • ベルヌーイ(1試行)と二項分布(n試行)を混同する

定着クイズ

ベルヌーイ分布 XX(成功確率 pp)の分散は?

ベルヌーイ分布の分散 p(1p)p(1-p) が最大になる pp は?

ベルヌーイ分布を独立にn個足し合わせると何分布になる?

関連:#二項分布

この用語を扱う問題(2

ベルヌーイとは|定義・公式とアクチュアリー試験の関連問題 | acpass