acpass

変数変換

知識マップ

確率公式

ひとことで言うと

「確率変数Xの分布が分かっているとき、Yをそれの式で変換した新しい変数Y=g(X)の分布を求める」手法です。例えば身長Xの分布から、身長の2乗Yの分布を求める、といった場面で使います。

変数変換のイメージ:x軸上の微小区間dxが、y=g(x)を通してy軸上の微小区間dyに対応するdxdyxyy=g(x)

x軸上の微小区間 [x,x+dx][x,x+dx] が、変換 y=g(x)y=g(x) を通してy軸上の微小区間 [y,y+dy][y,y+dy] に対応する。この対応関係の「伸び縮みの比率」がヤコビアン。

数式で表すと

fY(y)=fX(g1(y))ddyg1(y)f_Y(y)=f_X(g^{-1}(y))\,\big|\tfrac{d}{dy}g^{-1}(y)\big|

求め方は大きく2つあります。 ①分布関数法:まず Y=g(X)Y=g(X) の累積分布関数 FY(y)=P(Yy)F_Y(y)=P(Y\le y) を、g の逆関数を使って P(Xg1(y))=FX(g1(y))P(X\le g^{-1}(y))=F_X(g^{-1}(y)) のように書き換え、最後に微分して密度 fY(y)f_Y(y) を得ます。 ②ヤコビアン法:g が単調なら、上の手順を1つの公式にまとめたものが fY(y)=fX(g1(y))ddyg1(y)f_Y(y)=f_X(g^{-1}(y))\,\left|\dfrac{d}{dy}g^{-1}(y)\right| です。絶対値が付くのは、g が減少関数でも密度(必ず正の量)を保つため。右側の微分項は、x方向の微小幅がy方向では何倍に伸び縮みするかを表す「変換による幅の比率」です。 どちらも同じ答えに到達しますが、g が複雑なときはヤコビアン法が速く、g が単調でない(例: Y=X2Y=X^2 で X が正負両方を取りうる)ときは分布関数法で場合分けする方が安全です。

試験に出る性質

ヤコビアン法の公式

fY(y)=fX(g1(y))dg1(y)/dyf_Y(y)=f_X(g^{-1}(y))\,|dg^{-1}(y)/dy|。絶対値を忘れずに付ける。

単調増加なら符号の心配なし

gが単調増加なら g1g^{-1} も単調増加なので絶対値は常に正のまま外せる。

線形変換の特別な場合

Y=aX+b (a0)Y=aX+b\ (a\ne 0) なら fY(y)=1afX ⁣(yba)f_Y(y)=\dfrac{1}{|a|}f_X\!\left(\dfrac{y-b}{a}\right)

非単調なgは場合分け

Y=X2Y=X^2 のように1つのyに対しxが複数対応する場合は、分布関数法でそれぞれの場合を足し合わせる。

例で見る

XU(0,1)X\sim U(0,1) のとき Y=lnXY=-\ln X の分布を求める。g(x)=lnxg(x)=-\ln x は単調減少で、逆関数は x=g1(y)=eyx=g^{-1}(y)=e^{-y}dg1/dy=eydg^{-1}/dy=-e^{-y}fY(y)=fX(ey)ey=1×ey=ey (y>0)f_Y(y)=f_X(e^{-y})\,|-e^{-y}|=1\times e^{-y}=e^{-y}\ (y>0) これは Exp(1)Exp(1) の密度。実はこの変換が、U(0,1)U(0,1) の乱数から指数分布の乱数を作る逆関数法そのものです。

つまずきポイント

  • ヤコビアン項の絶対値を付け忘れる(gが減少関数だと密度が負になってしまう)
  • gが単調でない(例: Y=X2Y=X^2)のに、単調関数用の公式をそのまま使ってしまう
  • g1g^{-1} を求める際にXとYを取り違える

定着クイズ

ヤコビアン法の公式で絶対値を付けるのはなぜ?

Y=aX+b (a0)Y=aX+b\ (a\ne0) のとき fY(y)f_Y(y) は?

Y=X2Y=X^2 のように1つのyに複数のxが対応する変換を扱うのに適した方法は?

この用語を扱う問題(4