acpass

大数の法則

知識マップ

統計定理

ひとことで言うと

「同じ実験を何度も繰り返して平均を取ると、その平均はやがて本当の平均値(母平均)にどんどん近づいていく」という法則です。コインをたくさん投げれば表の割合が0.5に近づく、という日常の実感そのものです。

標本サイズnを増やすほど標本平均が真の母平均μに収束していく折れ線。帯はばらつきの目安で1/√nで狭まるnを増やすほど標本平均は母平均μに収束していく母平均μn(標本サイズ)

標本サイズ nn を増やすほど、標本平均 Xˉ\bar X が母平均 μ\mu(点線)に収束していく。帯はばらつきの目安で、nn が増えると 1/n1/\sqrt{n} で狭くなる。

数式で表すと

XˉPμ\bar X\xrightarrow{P}\mu

標本平均が nn\to\infty で母平均に収束する。チェビシェフで弱法則を示せる。

大数の法則(LLN)は、独立同分布な X1,X2,X_1,X_2,\dots(共通の母平均 μ\mu)について、標本平均 Xˉn=1ni=1nXi\bar X_n=\dfrac{1}{n}\sum_{i=1}^n X_inn\to\infty で母平均 μ\mu に収束する、と主張します(弱法則では確率収束 XˉnPμ\bar X_n\xrightarrow{P}\mu)。要するに「たくさん集めて平均すれば、偶然のブレは打ち消し合って本当の平均に落ち着く」ということです。 弱法則はチェビシェフの不等式から簡単に示せます。まず分散の性質から Var(Xˉn)=σ2/n\mathrm{Var}(\bar X_n)=\sigma^2/n。チェビシェフの不等式を Xˉn\bar X_n に当てはめると、任意の ε>0\varepsilon>0 について P(Xˉnμε)Var(Xˉn)ε2=σ2nε2n0P(|\bar X_n-\mu|\ge\varepsilon)\le\dfrac{\mathrm{Var}(\bar X_n)}{\varepsilon^2}=\dfrac{\sigma^2}{n\varepsilon^2}\xrightarrow[n\to\infty]{}0 となり、平均から ε\varepsilon 以上ずれる確率が0に潰れていく、つまり確率収束が言えます。図の帯が 1/n1/\sqrt{n} で狭まるのは、標準偏差 Var(Xˉn)=σ/n\sqrt{\mathrm{Var}(\bar X_n)}=\sigma/\sqrt{n} がこの速さで縮むためです。 混同しやすいのが中心極限定理(CLT)との違いです。大数の法則は「Xˉn\bar X_nμ\mu に収束する(どこへ落ち着くか)」を述べ、中心極限定理は「収束する途中の Xˉn\bar X_n のばらつきが、規格化すると正規分布の形になる(どんな形・速さで散らばるか)」を述べます。LLNは行き先、CLTはそこへ近づく際の散らばり方、と役割が分かれています。

試験に出る性質

主張

独立同分布の標本平均 Xˉn\bar X_n は母平均 μ\mu に収束する(弱法則は XˉnPμ\bar X_n\xrightarrow{P}\mu)。

チェビシェフで証明

P(Xˉnμε)σ2/(nε2)0P(|\bar X_n-\mu|\ge\varepsilon)\le\sigma^2/(n\varepsilon^2)\to0。分散が σ2/n\sigma^2/n で潰れるのが鍵。

収束の速さ

標本平均の標準偏差は σ/n\sigma/\sqrt{n}nn を4倍にしてばらつきが半分になる程度のゆるやかな速さ。

弱法則と強法則

弱法則は確率収束、強法則はほぼ確実な収束。試験では弱法則(チェビシェフ)が主役。

CLTとの違い

LLNは『どこへ収束するか』、CLTは『収束する際の散らばりの形(正規分布)と速さ』を述べる。

例で見る

分散 σ2=4\sigma^2=4 の母集団から n=100n=100 個の標本を取ると、標本平均の分散は Var(Xˉ)=σ2/n=4/100=0.04\mathrm{Var}(\bar X)=\sigma^2/n=4/100=0.04、標準偏差は0.2。 nn をさらに増やせばこの散らばりは0へ向かい、Xˉ\bar X は母平均 μ\mu に収束する。

つまずきポイント

  • 「これまで表が少なかったから次は表が出やすい」と考える(ギャンブラーの誤謬。収束するのは平均であって、個々の試行の確率は変わらない)
  • 大数の法則と中心極限定理を混同する(LLNは収束先、CLTは収束時の分布の形・速さ)
  • 標本『平均』ではなく標本『合計』が収束すると思い込む(合計 Xi\sum X_i は発散する。収束するのは平均 Xˉn\bar X_n

定着クイズ

大数の法則が主張するのは?

弱法則の証明で使う不等式は?

大数の法則と中心極限定理の違いとして正しいのは?

この用語を扱う問題(1