コラム
2023年06月20日

パロンドのパラドックス-負けるゲームを組み合わせると、勝つゲームに変わる !?

保険研究部 主席研究員 兼 気候変動リサーチセンター チーフ気候変動アナリスト 兼 ヘルスケアリサーチセンター 主席研究員 篠原 拓也

このレポートの関連カテゴリ

文字サイズ

世の中には様々なゲームがある。ギャンブルもその一形態といえるだろう。社会や自然界では、「ゲーム」と名がついていなくても、複数のプレーヤーが戦略の意思決定をして行動する状況がある。
 
こうした複数のプレーヤーが関わる状況について、数理的に分析や研究を行う分野として、ゲーム理論がある。ゲーム理論といえば、「囚人のジレンマ」がよく知られている。別々の部屋で尋問を受ける2人の囚人がいて、双方が協力し合って黙秘すると刑は軽くなる。だが、2人の囚人の間で連絡ができないため、それぞれの囚人は相手の囚人が黙秘を守るかどうかがわからない。その結果、2人とも自分の刑を軽くしようとして自白を選び、刑が重くなってしまう、というものだ。
 
ゲーム理論では、他にもいろいろな研究が行われている。その中には、2つの負けるゲームを勝つゲームに変える「パロンドのパラドックス」というものもある。今回は、これについて見ていこう。

◇ 必ず負ける2つのゲームを交互に行うと、絶対に勝つゲームに変わる!?

このパラドックスは、スペインの物理学者で、マドリード・コンプルテンセ大学教授のファン・パロンド氏によって考案された。彼は、著名な物理学者ファインマン氏が熱力学第二法則を説明するために仮構したブラウン・ラチェットと呼ばれる、永久機関のような思考実験上の装置を研究する中で、この考案にいたったという。
 
このパラドックスは、様々な形の具体的なゲームにアレンジされている。例えば、つぎのようなものがある。

(2つのゲーム)
 
AとBの2つのゲームがあります。所持金100ドルから初めて、それぞれのゲームで確率に応じて、ドルのやり取りをします。(なお、繰り返してゲームを行った結果、所持金がゼロやマイナスになった場合でも、そのままゲームを継続するものとします。)
 
(ゲームA)  毎回、1ドルを支払います。(常に負け)
 
(ゲームB)  現在の所持金が偶数の場合は、3ドルを受け取ります。(勝ち)
現在の所持金が奇数の場合は、5ドルを支払います。(負け)

ゲームAを繰り返して行うとしよう。毎回1ドルずつ支払っていくから、ゲームを続ければ続けるほど所持金が減っていく。
 
一方、ゲームBを繰り返して行うとすると、まず最初の所持金が偶数の100ドルなので、3ドル受け取って103ドルとなる。次に、所持金が奇数なので、5ドル支払って、98ドルとなる。続けて、101ドル、96ドル、99ドル、94ドル、…と3ドルの増加と、5ドルの減少を繰り返しながら、所持金は徐々に減っていく。
 
つまり、ゲームAもゲームBも続ければ続けるほど、所持金が減っていく「必ず負けるゲーム」となっている。
 
それでは、この2つのゲームを、ゲームBから交互に行ったらどうなるだろうか? 最初の所持金100ドルからスタートする。まず、ゲームBで、所持金が偶数なので3ドル受け取って、103ドルになる。次に、ゲームAで、1ドル支払って所持金は102ドルとなる。続いて、ゲームBで所持金が偶数なので、3ドル受け取って105ドル。以降、104ドル、107ドル、106ドル、109ドル、…と3ドルの増加と、1ドルの減少を繰り返しながら、所持金は徐々に増加していく。
 
つまり、ゲームAとゲームBを交互に繰り返すと、所持金が増えていく「絶対に勝つゲーム」に変わるわけだ。

◇ 確率を加味したゲームを考えてみる

ただ、必ず負けるゲームとか、絶対に勝つゲームというのは、そもそもゲームとは言えないのではないか、という読者からのご批判が聞こえてきそうだ。まことに、ごもっともだ。
 
そこで、確率要素を加味したゲームを考えてみる。定義として、プレーヤーの受取額の期待値がマイナスのゲームを「負けるゲーム」、プラスのゲームを「勝つゲーム」と呼ぶことにする。そのうえで、ある確率で勝ったり負けたりする、次のゲームを考えてみよう。

(2つのゲーム (確率要素を加味))
 
CとDの2つのゲームがあります。所持金100ドルから初めて、それぞれのゲームで確率に応じて、ドルのやり取りをします。(なお、繰り返してゲームを行った結果、所持金がゼロやマイナスになった場合でも、そのままゲームを継続するものとします。)
 
(ゲームC)  51%の確率で、1ドルを支払います。(負け)
49%の確率で、1ドルを受け取ります。(勝ち)
 
(ゲームD)  現在の所持金が3の倍数の場合
91%の確率で、1ドルを支払います。(負け)
9%の確率で、1ドルを受け取ります。(勝ち)
 
現在の所持金が3の倍数ではない場合
26%の確率で、1ドルを支払います。(負け)
74%の確率で、1ドルを受け取ります。(勝ち)

全体的に、かなり複雑なゲームになっている。特に、ゲームDは、所持金が3の倍数かどうかで場合分けをして、勝ち負けの確率が異なることとなり、とても複雑なものとなっている。

◇ ゲームCとゲームDはいずれも負けるゲーム

それでは、ゲームCとゲームDを調べてみよう。
 
まず、ゲームCは、1回のゲームでの負けの確率が勝ちの確率よりも少し大きい。ゲームCを繰り返して行えば、徐々に負けが込んで、所持金は減少していくだろう。ゲームCは負けるゲームということになる。
 
一方、ゲームDは見当がつきにくい。現在の所持金が3の倍数かどうかで、勝ちの確率が異なるためだ。
 
もし、所持金が3の倍数の状態が3分の1の割合で起こるならば、1回のゲームでの勝ちの確率は、

9% × 3分の1  +  74% × 3分の2  =  52.33%

と計算できて、50%を超えるため、ゲームDは平均的には勝つゲームということになる。ゲームDを繰り返して行えば、徐々に勝ちが負けよりも多くなり、所持金は増加していくことになるのだが…。
 
問題は、所持金が3の倍数の状態がどのくらいの割合で起こるのかということになる。これは、繰り返し行うゲームの展開しだいで揺れ動く。
 
今回のゲームでは、繰り返して行うと、所持金が3の倍数、3の倍数+1、3の倍数+2、の3つの状態のうち、どの状態になりやすいか(またはなりにくいか)が徐々に定まってくる。何千回、何万回も繰り返した場合、各状態の発生は一定の割合に収れんしていく。(※) その究極の状態を定常状態と呼ぶことにしよう。
 
(※)収れんについて、数学的には、マルコフ連鎖と呼ばれる状態の推移において、遷移確率の極限の挙動を検証する必要がある。重要な検討事項なのだが、今回は、そこには立ち入らないことにする。
 
定常状態で、所持金が3の倍数となる状態の割合をx0、3の倍数+1となる状態の割合をx1、3の倍数+2となる状態の割合をx2とおいてみよう。すると、つぎの関係式が導かれる。
 
所持金が3の倍数となるのは、3の倍数+1の状態で負けたときと、3の倍数+2の状態で勝ったときだから、

x0 = x1×26% + x2×74%
 
所持金が3の倍数+1の状態と3の倍数+2の状態についても同様に、

x1 = x2×26% + x0× 9%
x2 = x0×91% + x1×74%

となる。(なお、これら3つの関係式を両辺でそれぞれ合計すると、いずれも(x0+x1+x2)となるため、実際には、関係式として3本ではなく、2本分の意味しか持っていない)
 
そして、x0とx1とx2の合計は1だから、

x0 + x1 + x2 = 1
 
これらを連立方程式として解くと、x0=0.382、x1=0.155、x2=0.463となる。
 
この定常状態から、つぎの1回のゲームで獲得できる金額は、

x0×(9%-91%)+x1×(74%-26%)+x2×(74%-26%)=-0.017

と計算でき、平均して毎回0.017ドル支払うこととなる。
 
実際には、毎回のゲームの結果しだいで、ドルの受け取りや支払いがあり、状態が変わるわけだが、定常状態をもとに平均的な獲得額を計算すると、平均的にマイナス、つまり支払いとなるわけだ。すなわち、ゲームDは負けるゲームといえる。
Xでシェアする Facebookでシェアする

このレポートの関連カテゴリ

保険研究部   主席研究員 兼 気候変動リサーチセンター チーフ気候変動アナリスト 兼 ヘルスケアリサーチセンター 主席研究員

篠原 拓也 (しのはら たくや)

研究・専門分野
保険商品・計理、共済計理人・コンサルティング業務

経歴
  • 【職歴】
     1992年 日本生命保険相互会社入社
     2014年 ニッセイ基礎研究所へ

    【加入団体等】
     ・日本アクチュアリー会 正会員

公式SNSアカウント

新着レポートを随時お届け!
日々の情報収集にぜひご活用ください。

週間アクセスランキング

レポート紹介

【パロンドのパラドックス-負けるゲームを組み合わせると、勝つゲームに変わる !?】【シンクタンク】ニッセイ基礎研究所は、保険・年金・社会保障、経済・金融・不動産、暮らし・高齢社会、経営・ビジネスなどの各専門領域の研究員を抱え、様々な情報提供を行っています。

パロンドのパラドックス-負けるゲームを組み合わせると、勝つゲームに変わる !?のレポート Topへ