acpass

確率定理

ひとことで言うと

「率 λ\lambda で次々に起こるポアソン過程の事象を、1つずつ独立にコイン投げ(確率 pp で採用)して選り分けると、採用された事象の列もまたポアソン過程(ただし率は λp\lambda p)になる」という定理です。さらに採用された列と不採用の列は互いに独立になります。

率λのポアソン過程の各事象を確率pで採用すると、採用された事象(率λp)も不採用の事象(率λ(1-p))もそれぞれ独立なポアソン過程になる様子各事象を確率pで採用→採用・不採用ともに独立なポアソン過程元の過程:率λ採用(率λp)不採用(率λ(1−p))時間 t →

上段は率 λ\lambda の元のポアソン過程。各事象を独立に確率 pp で採用すると、採用(率 λp\lambda p)と不採用(率 λ(1p)\lambda(1-p))の2本に分かれ、しかも互いに独立なポアソン過程になる。

数式で表すと

Pois(λ)pPois(λp)\mathrm{Pois}(\lambda)\xrightarrow{p}\mathrm{Pois}(\lambda p)

ポアソン過程の各事象を確率 pp で独立採用すると、再びポアソン(率 λp\lambda p)。

間引き(thinning)は、率 λ\lambda のポアソン過程(concept: ポアソン過程)で起こる各事象を、独立に確率 pp で「採用」、確率 1p1-p で「不採用」と分類したとき、採用された事象だけを並べた列が再びポアソン過程になり、その率が λp\lambda p に変わる、という定理です。記号で書くと Pois(λ) p Pois(λp)\mathrm{Pois}(\lambda)\xrightarrow{\ p\ }\mathrm{Pois}(\lambda p) です。直感的には「同じ密度で起きていた点を、ランダムに pp の割合だけ残す」ので、単位時間あたりの点の数(率)がちょうど pp 倍に薄まる、と理解できます。一定区間で起こる件数を考えると、ポアソン件数 NPois(λt)N\sim\mathrm{Pois}(\lambda t) の各々を確率 pp で採用した採用件数は Pois(λpt)\mathrm{Pois}(\lambda p t) に従い、これは「ポアソン件数を二項間引きするとまたポアソンになる」という事実そのものです。 この定理のもっとも重要な発展点は、採用された事象(率 λp\lambda p)と不採用の事象(率 λ(1p)\lambda(1-p))が、それぞれポアソン過程であるだけでなく、互いに独立になることです。元は1本の過程だったのに、ランダムに振り分けた2本が独立になる、というのは直感に反して感じられますが、ポアソン過程の特別な性質です。一般化すると、各事象を確率 p1,p2,,pkp_1,p_2,\dots,p_kpj=1\sum p_j=1)で kk 種類に分類すると、種類ごとの事象列はそれぞれ率 λpj\lambda p_j の独立なポアソン過程になります。 保険での定番の使い方は、クレームの分類です。クレームが率 λ\lambda のポアソン過程で発生し、各クレームを独立に確率 pp で「大口」、1p1-p で「小口」に分類すると、大口クレームの発生は率 λp\lambda p のポアソン過程、小口クレームの発生は率 λ(1p)\lambda(1-p) のポアソン過程となり、しかもこの2つは独立です。だから大口と小口を別々のポアソン過程として独立にモデル化してよい、という実務上の便利さが生まれます。

試験に出る性質

間引きの定理

λ\lambda のポアソン過程の各事象を確率 pp で採用すると、採用列は率 λp\lambda p のポアソン過程になる。

件数での表現

NPois(λ)N\sim\mathrm{Pois}(\lambda) の各々を確率 pp で採用した採用件数は Pois(λp)\mathrm{Pois}(\lambda p)。ポアソンの二項間引きはまたポアソン。

採用・不採用の独立性

採用(率 λp\lambda p)と不採用(率 λ(1p)\lambda(1-p))はそれぞれポアソン過程で、しかも互いに独立。

多分類への一般化

確率 p1,,pkp_1,\dots,p_kkk 種に分けると、種類ごとに率 λpj\lambda p_j の独立なポアソン過程になる。

保険での用途

クレームを大口/小口などに確率分類すると、各タイプを独立なポアソン過程として別々にモデル化できる。

例で見る

事故クレームが率 λ=20\lambda=20 件/月のポアソン過程で発生し、各クレームを独立に確率 p=0.1p=0.1 で「高額クレーム」と分類する。高額クレームの発生は 率 λp=20×0.1=2\lambda p=20\times0.1=2 件/月のポアソン過程。 残りの低額クレーム(率 1818 件/月)とは互いに独立なので、2つを別々に扱ってよい。

つまずきポイント

  • 採用後の率を λ\lambda のままにする(間引きで率は λp\lambda p に薄まる。件数の平均も pp 倍)
  • 採用列と不採用列が独立にならないと思い込む(ポアソン過程では両者は互いに独立になる)
  • 間引いた結果がポアソンでなくなると誤解する(採用列・不採用列ともに再びポアソン過程になる)

定着クイズ

λ\lambda のポアソン過程の各事象を確率 pp で採用すると、採用列の率は?

間引きで得られる採用列と不採用列の関係は?

クレームを確率 pp で大口・1p1-p で小口に分類したときのモデル化として正しいのは?

この用語を扱う問題(3