【ゲーム理論】 【第1章】ゲーム理論入門


コースの概要: ここに画像の説明を挿入します

【例】数字を選択する

2 人の参加者、A と B が順番に [3,4,5,6,7,8,9] から整数を選択します (反復可能)。累計が100に達するとゲーム終了となります。このとき、選択した人数の合計が100人以上になった参加者が敗者となるように審査されます。先に行動した A はこのゲームに勝つことができますか? 最適な戦略は何ですか?
[答え]
ゲーム全体のプロセス:
ここに画像の説明を挿入します
前に選択した数字の合計が 97、98、99 に達することができれば、次の人は少なくとも を選択します。 3 なので、100 以上である必要があります。そうするとこの人は負けます。
ここに画像の説明を挿入します

では、B が最後のラウンドで選択したときに数字の合計が 97、98、99 になり、B が確実に負けるようになるように、各ラウンドで A の選択をどのように制御するのでしょうか。
それは、各ラウンドでコントロールできる数を見つけることです。
選択できる数字の範囲内で、2 人が選択した数字の最大合計は 12 であることが観察されているため、さまざまな数字の組み合わせを通じて、各ラウンドの合計が固定数 12 に達するように常に制御できます。 。その後、一度に 1 ラウンドずつ進めることができ、最初のラウンドでは、A が最初に勝つことができる番号を選択する必要があります。一般的な考え方は次のとおりです。
後方帰納法によれば、合計が 100 に近い場合、99 を取得した A が勝ちとなり、問題は 99 を取得することになります。同様に、問題は 87[=99-(3+9)]、75、63、51、39、27、15、3 を取得することです。逆方向の作業を続ける場合、最初に 3 を取得すると、あなたが勝つ。A が先に 3 を選択した場合、A が勝ちます。
ここに画像の説明を挿入します
しかし、上記の戦略を使用しない場合、A が最初のラウンドで 4 を選択した場合はどうなるでしょうか?
ここに画像の説明を挿入します
そうすれば、最終ラウンドでは A と B の合計が 11 未満でなければならないという事実に間違いなくつながります。その後、B の番では 99 になります。しかし、これは制御できません。B が 9 を選択すると、A が何を選択しても合計が 11 より小さくなることはなく、A は直接ゲームに負けます。
したがって、次のような命題が成り立つ。
【命題1】デジタルゲーム1においては、先手が勝たなければならない唯一の最善の対応戦略(戦略)を有する。

応答ペアの状況を考えてみましょう。この例では、A=3 の場合、B は X1 を選択し、次に A が Y1 を選択します。つまり、X1+Y1=12 (この状況を A の B に対する応答と呼びます)、したがって、A が勝つことが保証されます。A=3 の場合 (学生は、最初に A が他の数字である状況を試すこともできますが、状況は少し複雑になる可能性があります)、B は A+X1=12 を採用し、続いて Y1+X2=12 を採用します。この状況を、A に対する B の反応ペアと呼びます。
しかし、最初のゲームで先手プレイヤーが 3 を選択し、その後合計が 12 になる戦略を採用した場合、B がどのような応答をしても無駄になり、B は負けなければならない状況に直面することになります。
ここに画像の説明を挿入します
しかし、A が最初に 3 を選択せず​​に他の数字を選択した場合、B はリアクション戦略を使用して勝つ唯一のチャンスがあります。
下の図に示すように、A は最初のラウンドで 3 を選択しなかったため、3 より大きい数字しか選択できません。その後、B は最初のラウンドの合計を 13 にコントロールし、B は後続の各ラウンドで合計を 12 にコントロールします。すると、合計は 12*6+13=85 となります。そして最終ラウンドでは、B は合計を 12 にコントロールすれば勝つことができ、A の選択によっては合計を 13 または 14 にコントロールすることもでき、どちらも必勝戦略となります。
ここに画像の説明を挿入します
したがって、次の命題が成り立ちます。
[命題 2] ナンバーゲーム 1 で、先手が数字 A≠3 を選択した場合、後手は勝つ必要がある最良の対応戦略 (戦略) を持ち、すべての勝者に対して勝利する必要があります。 A の 3 に等しくない数がある場合、この戦略 (戦術) はユニークです。

100 点以上になった参加者が勝者になったらどうなるでしょうか?
逆帰納法によれば、合計が 100 に近づいた場合、88 点を取った人が勝ちとなり、88 点を掴むことが問題となります。同様に、76、64、52、40、28、16、4 を取得し、逆方向の作業を続ける (100-12n、
n=8 の場合、余りは 4)、という問題が考えられます。先に4つ取った人が勝ちです。最初に行動する A が先に 4 を選択し、A が勝ちます。

【例】バッシュゲーム

n 個の山に石があり、A と B の 2 人が交代で石を取り、毎回少なくとも 1 個、最大 m 個の石を取り、最後の石を取った人の勝ちです。
【解法】
石がn=m+1個あるとすると、一度に取れる石はm個なので、先手がどれだけ石を取っても、後手が必ず残りの石を取ることができます。最初の手は負けなければなりません。
石 n = (m+1)*r+s の場合、最初のプレイヤーが s 個の石を最初に取る必要があります。2 番目のプレイヤーが k 個の石を取り、最初のプレイヤーが m+1-k 個の石を取るとします。残りの石の数は (m+ 1)(r-1) 今後もこの取り方を守り、先に取った方が勝ちです。つまり、m+1の倍数を相手に任せる必要がある。
【命題3】バッシュゲームでは、石の数 n% (m + 1) = 0 の場合は後手の勝ち、石の数 n% (m + 1) ≠ 0 の場合は先手の勝ちです。

【例】シューティングゲーム

射手A、B、Cはくじを引いて順番を決め、Aの命中率は100%、Bの命中率は80%、Cの命中率は50%となります。
(1) 順番通りに射撃が行われ、C が先に撃った場合、C はどうすればよいでしょうか?
(2) 順番通りに射撃が行われた場合、C が生き残る可能性が最も高いことが証明されます。
(3) 各ラウンドで撃つ人がランダムに選ばれるとすると、撃った人が生き残る確率と命中率は全く逆であることが証明されます。

[回答]
追求すべき目標は 2 つあるはずです。まず自分の命を救うことを考慮し、次に誰を撃つかを検討します。
(1) 物事が順番に進み、C が最初に撃った場合、彼は何をすべきでしょうか? π A ( ABC ) \pi_A(ABC)
とします。円周率( A BC ) は、3 人全員が生きていて ABC の順に撃った場合に A が生き残る確率を意味し、他の手段も同様の意味です。
①Cが他の人を撃った場合、Aを撃たなければなりません。(命を守ることを第一に考えなければならないので、命中率の高い人を撃つことを優先することは間違いありません)
C が A に命中した場合、彼の支払いはπ C ( BC ) \pi_C(BC)円周率C(紀元前)
順序 BC では、C が生き残る確率は B の命中率に依存するため、B が C に命中した場合、C の生存確率は 0 になります。したがって、この場合、C の生存確率は 4 5 ∗ 0 = 0 \ frac{4}{ 5}*0=0540=0、ヒットがない場合 (確率は1 5 \frac{1}{5}51)、C が B と戦う時間です。
したがって、次の式があります: π C ( BC ) = π C ( CB ) / 5 \pi_C(BC)=\pi_C(CB)/5円周率C(紀元前)=円周率C( CB ) /5
π C ( CB ) = 1 2 × 1 + 1 2 × π C ( BC ) = 1 2 × 1 + 1 2 × 1 5 π C ( CB ) \pi_C(CB)=\frac{ 1}{2} \times 1+\frac{1}{2} \times \pi_C(BC)=\frac{1}{2} \times 1+\frac{1}{2} \times \frac{ 1}{5} \pi_C(CB)円周率C( CB )=21×1+21×円周率C(紀元前)=21×1+21×51円周率C( CB )
すると、次のことが得られます:
π C (CB) = 5 9、π C (BC) = 1 9 (C が A に当たる、C が生き残る確率) \pi_C(CB)=\frac{5}{9} , \pi_C(BC)=\frac{1}{9} (C が A にヒット、C が生き残る確率)円周率C( CB )=95円周率C(紀元前)=91( C がAに命中しCが生き残る確率)
A に命中しない場合は、②のような状況です。
② C が空中に発砲した場合。明らかに、A は C ではなく B に向かって撃ち、B は C ではなく A に向かって撃ちます。(命を守ることを第一に考えなければならないので、命中率の高い人を優先して撃つことは間違いない)。つまり、A と B はどちらかがアウトになるまで撃ち合い、その後 C が撃つ番になります。

A と B が撃ち合ったときに A が生き残った場合、この時点で C が生き残る確率はπ C ( CA ) = 1 2 \pi_C(CA)=\frac{1}{2}円周率C( C A )=21
A と B が撃ち合ったときに B が生き残った場合、この時点で C が生き残る確率はπ C ( CB ) = 5 9 \pi_C(CB)=\frac{5}{9}円周率C( CB )=95
なぜならπ C ( CB ) = 5 9 \pi_C(CB)=\frac{5}{9}円周率C( CB )=95π C ( CA ) = 1 2 \pi_C(CA)=\frac{1}{2}円周率C( C A )=21,無限C ( BC ) = 1 9 \pi_C(BC)=\frac{1}{9}円周率C(紀元前)=91したがって、C が空中に向かって撃つことが最善の選択です。
(2) 順番に発砲した場合、C の生存確率が最も高いことがわかります。
証明: ① A が B より先にシュートすると仮定すると、順序は CAB、ACB、または ABC になります。
C が空中に撃たれるため、A は必ず B を殺さなければなりません。 したがって、
π C ( CAB ) = π C ( ACB ) = π C ( ABC ) = 1 2 \pi_C(CAB)=\pi_C(ACB)=\ pi_C(ABC )=\frac{1}{2}円周率C( C A B )=円周率C( CB ) _=円周率C( BC ) _=21
于是可得:
π A ( C A B ) = π A ( A C B ) = π A ( A B C ) = 1 2 \pi_A(C A B)=\pi_A(A C B)=\pi_A(A B C)=\frac{1}{2} 円周率( C A B )=円周率( CB ) _=円周率( BC ) _=21
② B が A より先に撃ったとすると、順番は CBA、BCA、BAC の 3 通りが考えられます。次に、B は A に向かって射撃し、命中する確率は 4/5 なので、
π C ( CBA ) = π C ( BCA ) = π C ( BAC ) = 4 5 π C ( CB ) + 1 5 π C ( CA ) = 4 5 × 5 9 + 1 5 × 1 2 = 49 90 \begin{aligned} \pi_C(CBA) & =\pi_C(BCA)=\pi_C(BAC) \\ & =\frac{4}{5 } \pi_C(CB)+\frac{1}{5} \pi_C(CA) \\ & =\frac{4}{5} \times \frac{5}{9}+\frac{1}{5 } \time \frac{1}{2}=\frac{49}{90} \end{整列}円周率C( CBA ) _=円周率C( BCA ) _=円周率C( B A C )=54円周率C( CB )+51円周率C( C A )=54×95+51×21=9049
さらに
π A ( CBA ) = π A ( BCA ) = π A ( BAC ) = 4 5 × 0 + 1 5 × 1 2 = 1 10 π B ( CBA ) = 4 5 × 4 9 + 1 5 × 0 = 16 45 \begin{aligned} \pi_A(CBA)=\pi_A(BCA)=\pi_A(BAC)\\ =\frac{4}{5} \times 0+\frac{1}{5} \times \frac {1}{2}=\frac{1}{10} \\ \pi_B(CBA) & =\frac{4}{5} \time \frac{4}{9}+\frac{1}{5 } \times 0=\frac{16}{45} \end{整列}円周率( CBA ) _=円周率( BCA ) _=円周率( B A C )=54×0+51×21=101円周率B( CBA ) _=54×94+51×0=4516

(3) 各ラウンドで撃つ人がランダムに選ばれると、生存率と命中率が全く逆になることが証明されます。
【証明】π A [ A ] \pi_A[A]とする円周率[ A ] は、A が最初のショットを発射したときの A の生存確率を表します、π A \pi_A円周率A の全体的な生存確率を表します、π A { AB } \pi_A\left\{AB\right\}円周率{ A B } は、2 人の AB のうち誰が最初のショットを撃つかは任意であることを意味します。残りも同様に表現します。
次のラウンドで射撃するプレイヤーが任意に選択した場合でも、A と B はどちらか 1 人だけが生き残るまで撃ち合います。いずれにせよ、C が A よりも B と 1 対 1 で競争することを好むことは明らかなので、C に射撃の機会があれば、A に向かって射撃するでしょう。
次に、2 人の人の状況を分析します。
π A { AB } = 1 2 × 1 + 1 2 × 1 5 π A { AB } π A { AB } = 5 9 , π B { AB } = 4 9 \begin{aligned } & \pi_A\{AB\}=\frac{1}{2} \times 1+\frac{1}{2} \times \frac{1}{5} \pi_A\{AB\} \\ & \ pi_A\{AB\}=\frac{5}{9}, \quad \pi_B\{AB\}=\frac{4}{9} \end{aligned}円周率{ A B }=21×1+21×51円周率{ A B }円周率{ A B }=95円周率B{ A B }=94
以下推計:
π A { AC } = 1 2 × 1 + 1 2 × ( 1 2 × π A { AC } ) \pi_A\{AC\}=\frac{1}{2} \times 1+\frac {1}{2} \times\left(\frac{1}{2} \times \pi_A\{AC\}\right)円周率{ AC } _=21×1+21×(21×円周率{ A C } ) π A { AC } = 2 3 、π C { AC } = 1 3 \pi_A\{AC\}=\frac{2}{3}、\pi_C\{AC\}=\ frac とします
{1}{3}円周率{ AC } _=32円周率C{ AC } _=31
つまり、
π B { BC } = 1 2 × [ 4 5 × 1 + 1 5 π B { BC } ] + 1 2 × 1 2 π B { BC } \pi_B\{BC\}=\frac{1} {2} \times\left[\frac{4}{5} \times 1+\frac{1}{5} \pi_B\{BC\}\right]+\frac{1}{2} \times \ frac{1}{2} \pi_B\{BC\}円周率B{ 紀元前}=21×[54×1+51円周率B{ 紀元前} ]+21×21円周率B{ BC }
π B { BC } = 8 13 π C { BC } = 5 13 \begin{aligned} & \pi_B\{BC\}=\frac{8}{13} \\ & \pi_C\{BC\ }=\frac{5}{13}\end{整列}円周率B{ 紀元前}=138円周率C{ 紀元前}=135
さて、明らかに:
π A [ A ] = π A { AC } = 2 3 、 π B [ A ] = 0 、 π C [ A ] = 1 3 \pi_A[A]=\pi_A\{AC\}=\ frac{2}{3}、\pi_B[A]=0、\pi_C[A]=\frac{1}{3}円周率[ A ]=円周率{ AC } _=32円周率B[ A ]=0 円周率C[ A ]=31
同様に、
π B [ B ] = 4 5 π B { BC } + 1 5 π B 、 π A [ B ] = 1 5 π A π C [ B ] = 4 5 π C { BC } + 1 5 π C 和π C [ C ] = 1 2 π C { BC } + 1 2 π C , π A [ C ] = 1 2 π A π B [ C ] = 1 2 π B { BC } + 1 2 π B \ begin{ aligned} & \pi_B[B]=\frac{4}{5} \pi_B\{BC\}+\frac{1}{5} \pi_B, \pi_A[B]=\frac{1}{ 5} \pi_A \\ & \pi_C[B]=\frac{4}{5} \pi_C\{BC\}+\frac{1}{5} \pi_C \\ & \text { 和 } \pi_C[ C] =\frac{1}{2} \pi_C\{BC\}+\frac{1}{2} \pi_C, \pi_A[C]=\pi_1}{2} \pi_A\\ & \ pi_B[C] =\frac{1}{2} \pi_B\{BC\}+\frac{1}{2} \pi_B \end{整列}円周率B[ B ]=54円周率B{ 紀元前}+51円周率B円周率[ B ]=51円周率円周率C[ B ]=54円周率C{ 紀元前}+51円周率C  πC[ C ]=21円周率C{ 紀元前}+21円周率C円周率[ C ]=21円周率円周率B[ C ]=21円周率B{ 紀元前}+21円周率B
単純な解法を考えてみましょう:
π A = 1 3 [ 2 3 + 1 5 π A + 1 2 π A ] → π A = 20 69 π B = 1 3 [ 0 + 4 5 π B { BC } + 5 π B + 1 2 π B { BC } + 1 2 π B ] → π B = 24 69 π C = 1 3 [ 1 3 + 4 5 π C { BC } + 1 5 π C + 1 2 π C { BC } + 1 2 π C ] → π C = 25 69 \begin{aligned} & \pi_A=\frac{1}{3}\left[\frac{2}{3}+\frac{1}{5 } \ pi_A+\frac{1}{2} \pi_A\right] \rightarrow \pi_A=\frac{20}{69}\\ & \pi_B=\frac{1}{3}\left[0+\frac {4 }{5} \pi_B\{BC\}+\frac{1}{5} \pi_B+\frac{1}{2} \pi_B\{BC\}+\frac{1}{2} \pi_B \right ] \rightarrow \pi_B=\frac{24}{69}\\ & \pi_C=\frac{1}{3}\left[\frac{1}{3}+\frac{4}{5} \pi_C \{BC\}+\frac{1}{5} \pi_C+\frac{1}{2} \pi_C\{BC\}+\frac{1}{2} \pi_C\right] \rightarrow\ pi_C= \frac{25}{69}\end{整列}円周率=31[32+51円周率+21円周率円周率=6920円周率B=31[ 0+54円周率B{ 紀元前}+51円周率B+21円周率B{ 紀元前}+21円周率B円周率B=6924円周率C=31[31+54円周率C{ 紀元前}+51円周率C+21円周率C{ 紀元前}+21円周率C円周率C=6925
事有
π C > π B > π A \pi_C>\pi_B>\pi_A円周率C>円周率B>円周率
認定を受けましょう。
(ビデオは 2.23 の最初のセクションです)

ゲーム理論の基本概念:

ゲーム理論の基本概念: 参加者、戦略、行動、情報、利得関数、均衡結果など。

  • 要素 (PAPI): ゲームの主題 (参加者)、戦略 (アクション)、支払い、情報。
  • ルール: 参加者、一連のアクション、バランスのとれた結果。

参加者

独立した決定を下し、独立して行動し、結果に対して責任を負う個人または組織。
「ナチュラル」: 「バーチャル参加者」は
参加者数に応じて分割されます。

  • シングルプレイヤーゲーム
  • 2人用ゲーム
  • マルチプレイヤーゲーム

戦略

アクション

情報

ペイオフ関数

【例】100元を割る

2 人がそれぞれ最大 100 の非負の整数を報告します。申告した数値の合計が100を超えない場合は各人が申告した金額を受け取る(超えたお金は没収)、2人の申告した数値の合計が100を超えて数値が異なる場合はその人が受け取る小さい方の数字を報告した人が得られます。2 人の数字の合計が 100 を超え、数字が同じ場合は、1 人あたり 50 元を獲得します。

[解法] ゲームの 3 つの要素:
参加者の集合: N = { 1 , 2 } N=\left\{1,2\right\}N={ 1 2 }
戦略セット:S t = { 0 , 1 , 2... , 100 } , t = 1 , 2 S_t=\left\{0,1,2...,100\right\},t=1 ,2S={ 0 ,1 2... 100 }t=1
参加者2名ii _iの支払い
: ui = { si si + sj ≤ 100 ( i , j = 1 または 2 ) の si si + sj > 100 、および si < sj 100 − sj si + sj > 100 および si > sj 50 の場合si + sj > 100 、かつ si = sj u_i= \begin{cases}s_i & \text { when } s_i+s_j \leq 100(i, j=1 \text { or } 2) \\ s_i & \text { when } s_i+s_j>100, \text { and } s_i<s_j \\ 100-s_j & \text { when } s_i+s_j>100, \text { and } s_i>s_j \\ 50 & \text { when } s_i+s_j>100, \text { and} s_i=s_j\end{cases}あなた私は= s私はs私は100sj50 いつ _私は+sj100 (j=1または2    いつ _私は+sj>100  そして 私は<sj いつ _私は+sj>100  そして 私は>sj いつ _私は+sj>100  そして 私は=sj

おすすめ

転載: blog.csdn.net/Gorege__Hu/article/details/130453976