acpass

ハザード

知識マップ

確率用語

ひとことで言うと

ハザード(瞬間故障率)は、「いままで生き延びてきたものが、まさに今この瞬間に故障・死亡する勢い」を表す関数です。生命保険でいう死力 μx\mu_x とまったく同じ概念で、年齢が上がるほど大きくなるのが現実です。指数分布だけが特別に「一定」という性質をもちます。

ハザード関数h(t)を2例重ねた図。指数分布のハザードは時間tによらず一定λ=0.1の水平線(緑)。一方、増加型ハザードh(t)=0.02tは右上がりの直線(赤破線)で、高齢になるほど瞬間故障率が上がる現実の死亡率に近い。ハザードは生命保険数理の死力μ_xと同じ概念ハザード=瞬間故障率=死力μ_x。指数は一定、現実は増加型が普通一定 h=λ=0.1(指数)増加型 h(t)=0.02th(t)時間 t

ハザード関数 h(t)h(t) の2例。指数分布のハザードは時間によらず一定 λ=0.1\lambda=0.1(緑の水平線)。一方、増加型 h(t)=0.02th(t)=0.02t(赤破線)は右上がりで、高齢になるほど死亡率が上がる現実の死亡率に近い。ハザードは生命保険数理の死力 μx\mu_x と同じ概念。

数式で表すと

h(t)=f(t)1F(t)h(t)=\dfrac{f(t)}{1-F(t)}

瞬間故障率 h(t)=f(t)/(1F(t))h(t)=f(t)/(1-F(t))。指数分布では一定 λ\lambda

ハザード関数(瞬間故障率)h(t)h(t) は、「時刻 tt まで故障・死亡せずに生き延びてきたものが、その直後の微小時間で故障・死亡する条件付きの勢い」を表します。定義式は密度 f(t)f(t) と生存関数 S(t)=1F(t)S(t)=1-F(t) を使って h(t)=f(t)1F(t)=f(t)S(t)h(t)=\dfrac{f(t)}{1-F(t)}=\dfrac{f(t)}{S(t)} です。分子の f(t)f(t) は「全体の中でちょうど tt で起きる勢い」、分母の S(t)S(t) は「tt まで生き残っている割合」なので、その比は「生き残った者の中での」率になります。アクチュアリーにとって重要なのは、これが生命保険数理の死力 μx\mu_x(年齢 xx の人の瞬間死亡率)とまったく同じ概念だという点です。 ハザードは時間とともに変化するのが普通です。増加型ハザードは時間が経つほど h(t)h(t) が大きくなるもので、高齢になるほど死亡率が上がる現実の人間の死亡率はこの型です。例として h(t)=0.02th(t)=0.02t(時間に比例して線形に増加)を考えます。一方で一定ハザードは時間によらず h(t)=λh(t)=\lambda の特別な場合で、これは指数分布(concept: 指数分布)に対応します。指数分布のハザードが一定であることと無記憶性(concept: 無記憶性)は同値で、「過去にどれだけ生き延びても、これから先の故障の勢いは変わらない」という性質です。 ハザードと生存関数は累積ハザード H(t)=0th(s)dsH(t)=\int_0^t h(s)\,ds を介して結びつきます。 S(t)=exp ⁣(0th(s)ds)S(t)=\exp\!\Big(-\int_0^t h(s)\,ds\Big) 一定ハザード(λ=0.1\lambda=0.1)なら 0t0.1ds=0.1t\int_0^t 0.1\,ds=0.1t なので S(t)=e0.1tS(t)=e^{-0.1t}(指数分布の生存関数)。増加型の例 h(t)=0.02th(t)=0.02t では 0t0.02sds=0.01t2\int_0^t 0.02s\,ds=0.01t^2 なので S(t)=e0.01t2S(t)=e^{-0.01t^2}。ハザードが増える分だけ生存確率は速く減ります。

試験に出る性質

定義

h(t)=f(t)/(1F(t))=f(t)/S(t)h(t)=f(t)/(1-F(t))=f(t)/S(t)。生き残った者の中での瞬間故障・死亡率。

死力との同一性

生命保険数理の死力 μx\mu_x とまったく同じ概念。記号・分野が違うだけで中身は同一。

一定ハザード=指数

h(t)=λh(t)=\lambda(一定)は指数分布(concept: 指数分布)に対応。無記憶性(concept: 無記憶性)と同値。

増加型が現実的

高齢になるほど死力が上がる現実の死亡率は増加型。例 h(t)=0.02th(t)=0.02t。減少型(初期不良)もある。

累積ハザードと生存関数

S(t)=exp(0th(s)ds)S(t)=\exp(-\int_0^t h(s)\,ds)。ハザードを積み上げて指数の肩に乗せると生存確率になる。

例で見る

一定ハザード(指数, λ=0.1\lambda=0.1):0t0.1ds=0.1t\int_0^t 0.1\,ds=0.1t より S(t)=e0.1tS(t)=e^{-0.1t}(指数分布の生存関数に一致)。 増加型ハザードの例 h(t)=0.02th(t)=0.02t:累積ハザード 0t0.02sds=0.01t2\int_0^t 0.02s\,ds=0.01t^2 より S(t)=e0.01t2S(t)=e^{-0.01t^2}。 ハザードが時間とともに増える分、生存確率はより速く減る。

つまずきポイント

  • ハザード h(t)h(t) を密度 f(t)f(t) そのものと混同する(hhff を生存割合 S(t)S(t) で割った「生き残った中での」率)
  • 「ハザードは常に一定」と思い込む(一定は指数分布だけの特別な性質。現実の死亡率は増加型が普通)
  • 生存関数を S(t)=eh(t)S(t)=e^{-h(t)} と書いてしまう(正しくは累積ハザードを使い S(t)=e0th(s)dsS(t)=e^{-\int_0^t h(s)ds}。瞬間値ではなく積分)

定着クイズ

ハザード関数 h(t)h(t) の定義は?

ハザードが時間によらず一定になる分布は?

増加型ハザード h(t)=0.02th(t)=0.02t に対応する生存関数は?

この用語を扱う問題(1