秩序と情報とブロッコリー: ミニマックス戦略と混合戦略

前回、支配戦略均衡・反復支配戦略均衡について書いたが、それらのどちらも存在しない場合がある。この場合、なんとかして最悪の結果を避けるという考え方の「ミニマックス戦略」をとる方法がある。

下図のような利得行列を考える。ここでゲームはゼロサムゲームで、下図はプレイヤー甲の利得行列を表わしている。（プレーヤー乙は甲の利得の -1倍）

このゲームは両者に支配戦略均衡がない。そのため、プレイヤー甲は乙がどの戦略を選択しても最悪利得が最大になる戦略C（最悪利得が3で他の戦略よりも大きい）を選ぶ。一方、プレイヤー乙は、甲がどの戦略を選択しても最悪損失が最も小さくなる戦略F（最悪損失が-1で他の戦略より損失額が小さい）を選ぶ。

以上から、戦略CとFの組み合わせが均衡点となる。ここでこの組み合わせは以下のような性質がある。

プレイヤー甲が戦略Cを選んだ場合、乙は損失を最小にするために戦略Fを選ばざるを得ない。また逆に、プレイヤー２が戦略ｂを選んだ場合に、プレイヤ１は利益を最大にするために、戦略Cを選ばざるを得ない。

これは、戦略CとFの組み合わせが丁度、プレイヤー甲の最悪利益を極大にしプレイヤー乙の最悪損失を極小にする鞍点となっている。ゲームに鞍点があればその戦略の組み合わせが均衡点になる。

一方で、鞍点が存在しないようなケースもある。たとえば数のような利得行列の場合だ。（ゼロサムゲームで行列はプレイヤー甲側の利得）

この利得行列には支配戦略均衡が無いからミニマックス戦略で考えると戦略BとDの組み合わせとなる。しかし前述の鞍点がある例と異なり、プレイヤー甲がミニマックス戦略で戦略Bを選ぶなら乙は戦略Cを選んだ方が得。つまり鞍点が存在しない。

このような場合、画一的な戦術（純粋戦術：複数回行う場合に毎回同じ戦略を選択する）のではなく、確率的に戦略を選択（混合戦術）するのが現実的。

2013年4月19日金曜日

ミニマックス戦略と混合戦略

0 件のコメント:

コメントを投稿

自己紹介