acpass

混合戦略ナッシュ均衡

知識マップ

経済(ミクロ)用語

ひとことで言うと

じゃんけんのように純粋戦略(確定した戦略)では均衡がないゲームがある。そこで各戦略を確率的に混合することで均衡を達成するのが混合戦略。均衡では「相手がどの純粋戦略を選んでも、こちらの期待利得は同じ」という条件で各確率が決まる。

マッチング・ペニーゲームの利得行列と混合戦略均衡。純粋戦略のナッシュ均衡が存在しないため、各プレイヤーが50%の確率で各戦略を選ぶ混合戦略均衡が成立する。マッチング・ペニー(混合戦略の例)プレイヤーBプレイヤーA+1, −1Aが勝ち−1, +1Bが勝ち−1, +1Bが勝ち+1, −1Aが勝ち純粋戦略ナッシュ均衡は存在しない(どのマスも相手が逸脱したい)混合戦略均衡:AもBも各戦略を確率1/2で選ぶ→ どちらの戦略を選んでも期待利得が同じになる確率を選ぶ(ナッシュの定理:有限ゲームでは混合戦略NEが必ず存在)

マッチング・ペニーの利得行列。純粋戦略ナッシュ均衡が存在しない(どのセルでも一方が逸脱したい)。混合戦略均衡ではAもBも各戦略を確率1/2で選ぶ。

数式で表すと

均衡条件: 混合時、相手が全ての戦略で等しい期待利得を得る確率を選ぶ

各プレイヤーが複数の純粋戦略を確率的に混合する均衡。純粋戦略NEが存在しないゲームでも混合戦略NEは必ず存在(ナッシュの定理)。均衡確率は相手の期待利得を無差別にするよう設定。

混合戦略とは: 各純粋戦略を確率的に選択する戦略。 σi=(p,1p)\sigma_i = (p, 1-p) のように戦略1を確率p、戦略2を確率(1-p)で選ぶ。 ナッシュの定理: 有限人・有限戦略のゲームでは、(混合戦略を含む)ナッシュ均衡が少なくとも1つ存在する。 混合戦略均衡の求め方: 「相手の混合を所与とするとき、こちらはどの純粋戦略を選んでも期待利得が同じになる」ような混合確率を相手に選ばせる。 例:マッチング・ペニー ・Bが確率q(表)、1-q(裏)で混合するとき、Aの期待利得:  表を選ぶ場合:q×(+1) + (1-q)×(−1) = 2q−1  裏を選ぶ場合:q×(−1) + (1-q)×(+1) = 1−2q ・Aが無差別になる条件:2q−1 = 1−2q → q = 1/2 ・対称性からAも確率1/2で各戦略を選ぶ

試験に出る性質

純粋戦略と混合戦略の違い

純粋戦略:「必ず○○を選ぶ」という確定的戦略。混合戦略:「○○を確率pで選ぶ」という確率的戦略。純粋戦略はp=0またはp=1の特殊ケース。

混合戦略均衡の直感

混合均衡では、自分の混合比率を「相手が無差別になるよう」設定する(逆説的に聞こえるが重要)。相手が読みづらくなるような確率で混合する。じゃんけんを1/3ずつ出すのが最善なのと同じ原理。

社会的ジレンマとシグナリング

混合戦略は確率的行動の均衡理論的正当化として有用。また「強い型」と「弱い型」を持つプレイヤーが情報の非対称のもとでシグナルを送る状況(ベイジアン均衡・完全ベイジアン均衡)への拡張もある。

例で見る

マッチング・ペニーの混合均衡: Aが確率p(表)で選ぶとき、Bの表の期待利得:p×(−1)+(1−p)×(+1)=1−2p Bの裏の期待利得:p×(+1)+(1−p)×(−1)=2p−1 Bが無差別になる条件:1−2p=2p−1→p=1/2 均衡:A・Bともに確率1/2で表・裏を選ぶ 各プレイヤーの期待利得=0(ゼロサムゲーム)

つまずきポイント

  • 「混合戦略均衡では自分の混合確率は『相手が無差別になるよう』設定する」。自分の利得を最大化するために混合するのではなく、相手の最善反応を無差別にするよう混合する。この「他者指向性」が直感に反してわかりにくい点。
  • 「ナッシュの定理により有限ゲームでは混合戦略均衡が必ず存在する」。純粋戦略NEが存在しなくても混合戦略NEは保証されている。

定着クイズ

ナッシュの定理について正しいものはどれか。

混合戦略ナッシュ均衡での均衡確率の決まり方として正しいものはどれか。

マッチング・ペニーゲームで、プレイヤーBが確率q(表)で選ぶとき、プレイヤーAが無差別になる条件はどれか(表を選ぶ利得は+1/-1、裏を選ぶ利得は-1/+1)。

関連:#K023

この用語を扱う問題(0