周辺分布
知識マップ確率・用語
ひとことで言うと
2つ(以上)の変数の同時分布から、片方の変数だけに注目してその分布を取り出したものが周辺分布です。表なら「行ごと・列ごとの合計」、連続なら「一方の変数で積分」して得ます。注意したいのは逆方向:周辺分布が分かっても、元の同時分布は一意には決まりません。
の同時分布表。各セルが同時確率 。行方向に足すと の周辺分布(、)、列方向に足すと の周辺分布(、)が得られる。逆向き(周辺→同時)は一意でない。
数式で表すと
同時分布を一方の変数で積分(周辺化)して得る各変数単独の分布。
試験に出る性質
定義(連続)
。相手の変数 を積分で消して 単独の分布を得る。
定義(離散)
。表なら行(または列)ごとの合計が周辺分布。
周辺は同時から一意に出る
同時分布が与えられれば、足す/積分するだけで周辺分布は機械的に求まる。
逆は一意でない
周辺分布だけからは元の同時分布を復元できない。依存構造(結びつき)は周辺の外にある。
独立は特別な場合
(同時=周辺の積)が成り立つのが独立(concept: 独立性)。一般には成り立たない。
例で見る
同時確率表 。 周辺:/。 独立性チェック: なので独立でない。周辺だけから元の表は復元できない。
つまずきポイント
- 周辺分布から同時分布を一意に復元できると思い込む(無数の同時分布が同じ周辺を与える。中身=依存構造は復元不能)
- 周辺化のとき積分/合計する変数を取り違える( を出すなら相手の で積分する。自分の で積分しない)
- 「周辺分布の積=同時分布」が常に成り立つと誤解する(成り立つのは独立のときだけ。例の表では )
定着クイズ
連続の場合、 の周辺分布 の求め方は?
同時確率 のときの は?
周辺分布から元の同時分布を一意に復元できるか?
この用語を扱う問題(1)