教養として学ぶゲーム理論1 ~導入編~
0. 目次
1. まえがき
こんにちは。
最近大学でゲーム理論の講義を取ったので、復習がてら記事にしてみたいと思います。
今回は、ゲーム理論とはいったいどんなものなのかを、有名な囚人のジレンマを例に挙げて、初学者の方向けに解説します。
(注釈の内容は発展的なので、最初は読み飛ばしていただいても構いません。)
私自身も学部2年生でまだまだ勉強中ですので、誤りや修正すべき点があった場合は遠慮せず指摘していただけるとうれしいです。
2. そもそもゲーム理論って?
「ゲーム」といわれるとビデオゲームを想像する方が多いと思われますが、ビデオゲームの理論ではありません。
実は、ゲーム理論(game thoery)は経済学の枠組みの一つであり、戦略的状況(strategic environment)を扱います。
戦略的状況とは、他者の行動が自身の利益に影響する状況を指します。*1
例えば、サッカーが好きで野球が嫌いなAさんと、野球が好きでサッカーが嫌いなBさんが、サッカーと野球のどちらで遊ぶか決めようとする状況は戦略的状況です。
なぜなら、Bさんが妥協してサッカーをやろうと言ってくれると、サッカー好きなAさんはうれしいですが、野球を提案されるとAさんは嫌な気持ちになります。逆も然り。
まさに、Bさんの行動がAさんの幸福度に影響していますよね。
こういった戦略的状況を分析するための枠組みがゲーム理論です。
次に、囚人のジレンマを例に出して、実際に戦略的状況を分析してみましょう。
3. 囚人のジレンマ
以下の状況を考えてみましょう。
- 2人の囚人A, Bが、別々の取調室で取り調べを受けている
- 実は、2人は同じ詐欺事件の共犯である
- 2人は黙秘か自白を選べる
- 2人とも黙秘を選ぶと、証拠不十分で詐欺事件の犯人として逮捕することはできないが、余罪について懲役2年となる
- 一方が黙秘、もう一方が自白すると、自白した方は捜査に協力してくれたということで司法取引により懲役1年で済み、黙秘した方は懲役5年となる
- 2人とも自白を選ぶと、情状酌量で懲役3年となる
ここで囚人A, Bの利得(幸福度)を、とすることにします。懲役の年数が長いほど幸福度は下がるからです。
この戦略的状況をわかりやすく視覚化するために、利得表というものを使ってまとめてみます。
表の見方についてですが、例えばAが黙秘、Bが自白を選ぶ時、A, Bの利得はそれぞれ-5, -1と読み取ることができます。
利得表の見方も分かったところで、さっそく分析に入りたいと思います。
3.1. 囚人Aの戦略
さて、まずは囚人Aがどんな行動を選択すべきか考えてみましょう。*2
3.1.1.囚人Bが黙秘を選ぶ時
仮に囚人Bが黙秘を選ぶとしたら、囚人Aは黙秘と自白のどちらを選ぶべきでしょうか。
利得表を使って考えてみます。
囚人Bが黙秘を選ぶ時、
- 囚人Aが黙秘を選ぶと、囚人Aの利得は-2
- 囚人Aが自白を選ぶと、囚人Aの利得は-1
利得は大きい方がうれしいので、囚人Aは自白を選ぶのが良いですね。
3.1.2. 囚人Bが自白を選ぶ時
同様に利得表を使って考えます。
囚人Bが自白を選ぶ時、
- 囚人Aが黙秘を選ぶと、囚人Aの利得は-5
- 囚人Aが自白を選ぶと、囚人Aの利得は-3
したがって、こちらも囚人Aは自白を選ぶのが良いですね。
3.1.3. 囚人Aはどんな行動をすればよいか
以上より、囚人Bが黙秘と自白のどちらでも、囚人Aは自白を選ぶべきだということが分かりました。*3
3.2. 囚人Bの戦略
囚人Aのときと同様に、囚人Bについても考えてみます。
3.2.1. 囚人Aが黙秘を選ぶ時
囚人Aが黙秘を選ぶ時、
- 囚人Bが黙秘と選ぶと、囚人Bの利得は-2
- 囚人Bが自白を選ぶと、囚人Bの利得は-1
よって、囚人Bは自白を選ぶのが良いですね。
3.2.2. 囚人Aが自白を選ぶ時
囚人Aが自白を選ぶ時、
- 囚人Bが黙秘を選ぶと、囚人Bの利得は-5
- 囚人Bが自白を選ぶと、囚人Bの利得は-3
よって、囚人Bは自白を選ぶのが良いですね。
3.2.3. 囚人Bはどんな行動をすればよいか
以上より、囚人Aが黙秘と自白のどちらでも、囚人Bは自白を選ぶべきだということが分かりました。*4
3.3. 結局どんな結果が導かれるか
これまでの分析により、囚人AとBは、お互いが別の取調室にいるので相手の選択を知ることはできませんが、相手の選択が何であろうと自白を選ぶのが良いということがわかりました。
したがって、このゲームでは囚人A, Bがともに自白を選ぶという結果に落ち着きそうです。*5
このとき、2人の利得は-3となります。
3.4. ジレンマといわれる理由
2人が自身の利得を最大化しようと行動した結果、2人は-3という利得を得るわけですが、仮に2人が黙秘を選ぶことができれば、-2というさらに高い利得を得ることができます。
ですが、これまで行ってきた分析によれば黙秘は選択されません。なぜでしょう。
2人がある瞬間、両方が黙秘を選べば、両方が自白を選ぶ時より高い利得を得られるということに気づいたとします。ですが、次の瞬間、相手が黙秘を選んでいるときに自分が自白を選べば、-1というさらに高い利得を得られることを発見してしまいます。すると、自身の利得を最大化しようと行動する二人は、結局自白を選ぶことになり、結果として両方が黙秘を選ぶ時よりも低い利得を得ることになってしまうのです。
このように、より高い利得を得られる戦略があるのにもかかわらず、それを選択できないということで、ジレンマと呼ばれているのです。*6
4. 身近な囚人のジレンマ
囚人のジレンマのような状況は案外身近にあります。
小学校や中学校でよくある合唱の朝練について考えてみましょう。
次を仮定します。
- 「あなた」と「友達」は2週間後の合唱コンクールに向けて練習に励んでいるが、もっと練習が必要だということで朝練を導入した
- 朝練に参加するかどうかは任意である
- 2人とも朝練にいくと、合わせて練習ができるので上達してとてもうれしい
- 一方が朝練に行き、もう一方が朝練に行かないと、朝練に行く方は一人で練習することになる上、サボられたということでとても悲しいが、朝練に行かないほうは早起きしなくて済むのうれしい
- どちらも朝練に行かない場合、早起きしなくて済むのでうれしいが、歌自体は上達しないので少し残念
これらをもとに、次のような利得表を考えます。
これまでと同様に分析すると、
となりますので、「あなた」も「友達」も朝練に行かない、ということになります。
朝練に行った方がいいのはわかるけど、行きたくなくてサボってしまうという行動をゲーム理論で説明できました。これでサボってしまっても先生に言い訳できますね!
(私の中学では半ば強制だったので毎回朝練に参加していましたが、完全に任意だと言われたら間違いなくサボってしまっていたと思います...)
このように、日常のふとした行動をゲーム理論で単純明快に説明できることがあります。探してみると面白いかもしれませんね。
5. あとがき
今回は、初学者向けのゲーム理論入門ということで、囚人のジレンマを例に挙げながら解説してきました。あくまで導入なので、専門用語や厳密な定義は与えずに進めましたが、それでもなかなか興味深い分析ができたのではないでしょうか。これをきっかけに、ゲーム理論に興味を持っていただけたら幸いです。
次回もお楽しみに!
*1:ここでいう「利益」とは、金銭的な利益に限らず幸福度も含まれます。ProfitではなくBenefitといえばわかりやすいでしょうか。
*2:今回の囚人のジレンマのように、お互いの行動がわからない、もしくは同時に行動を決定するようなゲームを同時手番ゲームというのですが、同時手番ゲームでは戦略と行動は同じになります。一方、時間的な流れを考慮する展開形ゲームというゲームでは戦略と行動は異なるので注意が必要です。
*3:囚人Aにとって、自白は強支配戦略です。
*4:囚人Bにとって、自白は強支配戦略です。
*5:囚人A, Bがともに自白を選ぶという戦略組はナッシュ均衡です。支配戦略の組は唯一のナッシュ均衡となります。
*6:囚人のジレンマを無限回繰り返すゲームでは、トリガー戦略というものを考えると2人は協力して黙秘を選ぶことができるようになります。
*7:「あなた」にとって、朝練に行かないという戦略は強支配戦略です。
*8:「友達」にとって、朝練に行かないという戦略は強支配戦略です。