ゲームの理論を探る(その2)-ナッシュ均衡とパレート最適の求め方

ゲーム理論とは

画像の説明

 ゲームの理論とは、お互いに影響を与え合うメンバー同士で意思決定を分析する理論です。ゲームの理論は様々な場面に使えます。

寡占市場とゲームの理論

 寡占市場とは供給者が少数である市場であるので、お互いの行動が影響しあいます。このことを戦略的相互依存性といいます。ライバルの出方によって自社の利益も変わってくるので、情報が不確実となります。情報が不確実になりますと、特定ライバル企業の行動を予測しながら戦略を考えることになりゲーム理論が成り立ちます。

ゲーム理論の3要素とは

 皆さんは良くゲームをされると思うので、ゲームの設定で例えて見ます。
• プレイヤー:意思決定を行う主体=企業の事
• 戦略:各プレイヤーの選択肢=価格維持と値下げ
• 利益:特定の戦略を選んだ結果=利益や利潤

ゲームには

1:協力して全体利益の最大化を考える協力ゲームと
2:自社利益の最大化だけを考える非協力ゲーム

が存在します。自社利益の最大化だけを考えるのが非協力ゲームですが、この非協力ゲームの戦略がナッシュ均衡に相当します。つまり自社の利益を最大まで維持する戦略がナッシュ均衡となると解釈できます。

ナッシュ均衡とは

 ナッシュ均衡とは、非協力ゲームにおいてゲームの参加者全員が、相手の戦略に対して最適な戦略を採用している状態をいいます。均衡とは落ち着いていて変化が無い状態をいいます。自社にとって損失が一番少ない戦略をとることが優先されます。

画像の説明

 例えば、現代の核兵器の保持がまさにナッシュ均衡です。お互いが持っていても、打ちさえしなければ向こうは打ってきません。その代わり、撃てば反撃してくることが分かっているので、にらみ合いが均衡しています。つまりナッシュ均衡となります。

 また、お互いが打たなくても、打ち合いしてもナッシュ均衡となります。ナッシュ均衡は複数の場合もあれば、ない場合もあるのでナッシュ均衡が全て望ましい状態とは限りません。

パレート最適とは

 複数ある組合せのなかで、全体の利得が最大となる組合せを導く方法であり、組合せの中でもっとも理想的な場合であると言えます。別の言い方をすると、相手の効用を減少させずに、自分の効用を上げるようにする選択のことです。最終的にはパレート最適を得るべく戦略を巡らすことになります。

利得表とは

 ナッシュ均衡は表を使って説明できますが、この表を利得表と言います。複雑に3〜4社が絡むと複雑になるので、分かりやすくするため多くは2社のみで説明されます。

 ナッシュのゲーム理論では、互いの利得を表すゲーム盤上で、ナッシュ均衡とパレート最適を求めるゲームとなります。例えば、図は囚人のジレンマを扱ったゲームですが、ナッシュ均衡は(白状、白状)を選択した場合に相当し、一方、パレート最適は(否認、否認)に相当する例です。

画像の説明

ナッシュ均衡とパレート最適を求める手順

 今回はまず機械的にナッシュ均衡とパレート最適を求める手法を確認するだけで、具体的な場面での応用は後日に扱うことにします。

その1…ナッシュ均衡とパレート最適が各々存在する場合

画像の説明

 企業Aは戦略a、戦略bを採用でき、企業Bは戦略c、戦略dを採用することができます。また、企業Aと企業Bのそれぞれの戦略に対する利得は次の利得表で与えられるものとします。

 基本的なやり方は、企業Aを主人公にした場合、仮に企業Bが戦略cを採用したら、企業Aは戦略aと戦略bのどちらが良いかを判断します。また、企業Bが戦略dを採用したら、企業Aは戦略aと戦略bのどちらが良いかを判断します。

 また、企業Bを主人公にした場合には、仮に企業Aが戦略aを採用したら、企業Bは戦略cと戦略dのどちらが大きな利得を得られるかを判断します。また、企業Aが戦略bを採用したら企業Bは戦略cと戦略dのどちらで大きな利得を得られるかを判断します。

画像の説明

 具体的に利得表を使ってやってみます。まず企業Aの立場に立って考えす。

画像の説明

・ 企業Bがcの戦略を取った時には、aの戦略で利得3、bの戦略で利得6を得るので、企業Aはbの戦略を取るのが望ましいと言えます。
・ 企業Bがdの戦略を取った時には、aの戦略で利得9、bの戦略で利得10を得るので、
企業Aはbの戦略を取るのが望ましいと言えます。

 次に企業Bの立場に立って考えてみます。

画像の説明

・ 企業Aがaの戦略を取った時には、cの戦略で利得9, dの戦略で利得8を得るので、企業Bはcの戦略を取るのが望ましいと言えます。
・ 企業Aがbの戦略を取った時には、cの戦略で利得5、dの戦略で利得2を得るので、企業Bはcの戦略を取るのが望ましいと言えます。

 ナッシュ均衡は、逆にしたものが存在するというように、互換性のあるものとなります。今回の例では、企業Aがb、企業Bがcの戦略を選択した場合に相当します。

 パレート最適は、他の消費者の効用を減少せずに、もう一方の消費者の効用を上げるようにする(a, d)の選択です。今回の場合、(b, c)はナッシュ均衡であるが、パレート最適ではありません。

画像の説明

その2…ナッシュ均衡とパレート戦略が同時出現

画像の説明

 プレイヤー1Aとプレイヤー2は、それぞれ2種類の戦略をもっていて、その利得行列は図のように与えられています。利得行列の各要素は、(プレイヤー1の利得、プレイヤー2の利得)です。

画像の説明

 プレイヤー1、プレイヤー2は相手の戦略を互いに知っているとして、自己の利益が最大になるような戦略はどれかを考えます。

画像の説明

プレイヤー1の立場に立って考えます。

・ プレイヤー2がCの戦略を採ったら、プレイヤー1はAの4とBの10を比較し、Bを採った方が望ましいと判断します。
・ プレイヤー2がDの戦略を採ったら、プレイヤー1はAの7とBの11を比較し、Bを採った方が望ましいと判断します。

画像の説明

 プレイヤー2の立場に立って考えます。

・ プレイヤー1がAの戦略を採ったら、プレイヤー2はCの10とDの6を比較し、Cを採った方が望ましいと判断します。
・ プレイヤー1がBの戦略を採ったら、プレイヤー2はCの9とDの3を比較し、Cを採った方が望ましいと判断します。

 従って、互いに最適反応の場所の組み合わせであるナッシュ均衡は(10、9)で現れます。またその組み合わせがパレート最適でもあります。

画像の説明

 ゲームの理論で、ナッシュ均衡やパレート最適の場所を求める機械的操作は慣れれば簡単だと思いますが、皆さんどう思われますか。



コーディネーター's BLOG 目次