ゲームの理論を探る(その4)-環境問題解決をゲーム理論で如何に図るか
環境対策
A国とB国が環境対策をするか、しないかを考えているとします。
利得表の設定
・(100、100):
A国とB国の両国が環境対策をとれば、環境が良くなってA国もB国も利得は高くなります。
・(50, 50):
A国もB国も環境対策をとらないとすれば、環境はメチャクチャ悪くなり、両国とも利得は低くなります。
・(120, 30):
A国は環境対策をとらない、B国は環境対策をとる場合です。今、環境対策をするにはお金がかかります。その時、A国は環境対策をしませんが、B国は正直に環境対策をします。すると、A国の利得はメチャクチャ大きくなります。なぜならば、A国は環境対策をせずとも、B国の環境対策の恩恵を若干受けるからです。B国は費用が掛かった上に、A国のせいで環境はそれほど向上しないために、利得は30と低くなります。
・(30, 120):
A国は正直に頑張って環境対策をしたのだけども、B国は対策をとらなかった場合です。この場合はA国の利得は30、B国の利得は120となります。
最適反応
まずA国の立場に立って「最適反応」を考えてみます。

・ B国が環境対策をとってきた場合には、A国にとって有利な利得は、環境対策をとった場合の100と、とらない場合の120を比べて、当然対策をとらない場合の120を選ぶことになります。
・ B国が環境対策をとらないとすると、こちらが対策をとることにすればむしろ悪影響を受け30の利得となります。一方、環境対策をとらないとすれば、これは両方が環境対策を放棄したことになり、全体の環境はますます悪くなり利得は互いに50、50と低くなります。しかし、A国にとっては、対策をとって相手の悪影響を受けるよりは、全体として環境が悪い方がまだましなので50を採択します。
次に、Bの気持ちになって「最適反応」を考えます。

・ A国が対策をとると仮定しますと、B国にとって有利なのは環境対策をとらない120となります。
・ A国が対策をとらないとすると、B国も対策をとらない方が良いので50を選びます。
ナッシュ均衡

そして、どちらも最適反応を採っている場所がありますが、これを「ナッシュ均衡」と呼びます。これは各プレイヤーの最適反応の組み合わせの場所です。(50、50)の場所は互いが環境対策をとらない場合で、両方が一緒に選択しているのでこれはナッシュ均衡です。
更に、表をみてみますと、対策をとらない・対策をとらない場合は両国とも100の利得が得られ、こちらの方が(50、50)のナッシュ均衡より有利です。これは、情報の交換により互いが協力できる状況が(100、100)の場所となります。これはまさに囚人のジレンマとなっており、協力した方がいい時に協力できなくて、どっちも損する構造になっています。

そして、(50、50)から(100、100)に移動することを「パレート改善」と言います。どちらの国からも文句が出ず、少なくとも1方の国が得をする状況の変化です。文句がでるのは、自分の利得が下がるときであり、もし変わらなかったら文句は言えないわけです。
そして、左上(100、100)は、ナッシュ均衡からみて、相手国の効用を減少させずに、自分の効用を上げるようにする選択となっていますし、これ以上のパレート改善できません。これは「パレート最適」です。
お互いに自国にとって損失が一番少ない場所である戦略ナッシュ均衡は、A国、B国ともに環境対策をとらなかった場合です。しかし、同時に環境対策とる場所(100、100)でパレート最適となっており、まさに囚人のジレンマとなっています。
囚人のジレンマに陥ったらどうすれば良いのでしょうか。ナッシュ均衡から抜け出すことはなかなか難しいわけです。A国、B国のいずれかの国が対策をとるとむしろ損をすることになるからです。だから悪いところに落ち着いているといえます。
この場合、互いの国々が情報を交換仕合い、世界で一気に環境対策しようと決めることで、囚人のジレンマを抜け出すことができます。すべての国の協調歩調が必要なわけです。みなさんはどう思われますか。