สมดุลย์แบบเบย์ที่สมบูรณ์แบบ


8

ฉันได้รับคำถามที่ฉันดิ้นรนกับ:

ใช้เกม Dilemma ของ Prisoner's Standard และพิจารณาว่าเล่นสองครั้ง (ผู้เล่นสังเกตผลของเกมแรกก่อนเล่นเกมที่สอง) พิจารณาความเชื่อในแง่ของ node player 2 ที่อยู่ในชุดข้อมูล

ค้นหาความสมดุลย์แบบเบย์ที่สมบูรณ์แบบที่อ่อนแอ (กลยุทธ์และความเชื่อ) ซึ่งกลยุทธ์นั้นไม่ใช่สมดุลที่สมบูรณ์แบบของเกมย่อย

ดังนั้นในภาวะที่กลืนไม่เข้าคายไม่ออกของนักโทษ:

(Defect, Defect) เป็นแนชที่ไม่เหมือนใครและยังเป็นเกมย่อยที่สมบูรณ์แบบไม่เหมือนใคร

แต่เราจะได้สมดุลแบบเบย์ที่สมบูรณ์แบบที่ไม่เกี่ยวข้องกับข้อบกพร่องได้อย่างไร แน่นอนว่าสิ่งนี้มีความโดดเด่นอย่างเคร่งครัด . .

คำถามนี้ผิดหรือเปล่า?

จากนั้นมันก็จะถามหาสมดุล (ซึ่งเราพิจารณาลำดับของกลยุทธ์ต่าง ๆ )

คำถามนี้ผิดหรือฉันเข้าใจผิดแนวคิดเหล่านี้หรือไม่


นั่นไม่ได้เป็นการตอบคำถาม แต่เป็นเพียงจุดให้ความรู้ . . ในความเป็นจริงกลยุทธ์ต้องประกอบด้วย 5 องค์ประกอบ
Brian

ให้ความคิดเห็นของคุณตอนนี้ฉันคิดว่าปัญหาของคุณอยู่ที่อื่น: หากคุณเลือกกลยุทธ์ที่โดดเด่นในเกมย่อยที่อยู่นอกเส้นทางสมดุล (ดังนั้นสิ่งที่ไม่เกิดขึ้นจริง) ผลตอบแทนของคุณจะไม่ลดลง
Giskard

ดังนั้นฉันจึงเข้าใจว่าความเชื่อนอกเส้นทางสมดุลอาจเป็นกฎเกณฑ์ (และไม่จำเป็นต้องเป็นไปตามการปรับปรุง Bayesian) แต่ฉันอยู่ภายใต้การแสดงผลที่มีเหตุมีผลตามลำดับต้องถือ (เช่นได้รับความเชื่อเหล่านั้นบุคคลจะต้องเล่น กลยุทธ์ที่ดีที่สุดของพวกเขา) ดังนั้นเพื่อตอบสนองต่อข้อเสนอแนะของคุณกลยุทธ์ที่โดดเด่นจะไม่ละเมิดความเป็นเหตุเป็นผลตามลำดับหรือไม่
ไบรอัน

3
@denesp: PBE ที่อ่อนแอนั้น "อ่อนแอ" ไม่ใช่เพราะไม่จำเป็นต้องมีเหตุผลต่อเนื่องออกจากเส้นทางที่สมดุล แต่เพราะมันไม่ต้องการความเชื่อที่จะสอดคล้องกับ Bayes ออกกฎเส้นทางสมดุล ในขณะที่ฉันยอมรับว่าในกรณีของภาวะที่กลืนไม่เข้าคายไม่ออกของนักโทษซ้ำสองครั้ง (PD) ไม่มี WPBE ที่ไม่มีกลยุทธ์สมบูรณ์แบบที่ไม่ใช่ subgame ข้อสรุปนี้ไม่ได้ถือโดยทั่วไป เหตุผลก็คือเนื่องจากข้อบกพร่องเป็นกลยุทธ์ที่มีอิทธิพลอย่างยิ่งใน PD ดังนั้นสำหรับความเชื่อใด ๆ ออกจากเส้นทางสมดุล (แม้ว่าจะไม่สอดคล้องกับกฎของ Bayes) ข้อบกพร่องยังคงมีเหตุผลตามลำดับ
Herr K.

1
อย่างไรก็ตามสำหรับเกมที่ไม่มีกลยุทธ์ที่โดดเด่นเราสามารถจัดการกับความเชื่อในความสมดุลในวิธีที่จะทำให้กลยุทธ์ที่สมบูรณ์แบบที่ไม่ใช่เกมย่อยให้มีเหตุผลตามลำดับ หากเราเสริมความแข็งแกร่งให้สอดคล้องกับความเชื่อ (เช่นจำเป็นในดุลยภาพตามลำดับ) โดยบังคับให้เบย์ออกกฎเพื่อหยุดยั้งความสมดุลจากนั้นเราสามารถแยกกลวิธีที่สมบูรณ์แบบที่ไม่ใช่เกมย่อย ดังนั้นเราจึงมีผลลัพธ์ที่สมดุลตามลำดับแสดงถึงทั้ง WPBE และ SPE
Herr K.

คำตอบ:


2

ปล่อยให้กลยุทธ์ของผู้เล่น 1 ถูกแทนด้วย (x11,xDD1,xD1,xD1,x1) ที่ไหน x1 เป็นการกระทำรอบแรกของผู้เล่น 1 xDD1 เป็นการกระทำที่เกิดขึ้นในชุดข้อมูลซึ่งผู้เล่นทั้งสองเสียในรอบแรก xD1 เป็นการกระทำที่ชุดข้อมูลซึ่งผู้เล่น 1 เสียและผู้เล่น 2 ร่วมมือในรอบที่ 1 เป็นต้นโปรดทราบว่าสิ่งที่ชอบ (x11,x21) (กับ x21การกระทำที่เกิดขึ้นในรอบที่ 2) ไม่ได้เป็นข้อกำหนดเฉพาะของกลยุทธ์ของผู้เล่น 1 เนื่องจากเราจำเป็นต้องระบุพฤติกรรมในแต่ละชุดข้อมูลแยกจากกัน กำหนดกลยุทธ์ของผู้เล่น 2 ในทำนองเดียวกัน อย่างไรก็ตามความสมดุลแบบเบย์ที่สมบูรณ์แบบนั้นต้องระบุความเชื่อของผู้เล่นด้วยμ1,μ2. นี่เป็นส่วนสำคัญของการกำหนดดุลยภาพ ดังที่เราจะเห็นด้านล่างคำถามนั้นมุ่งไปสู่การทำความเข้าใจว่าสมดุลที่แตกต่างกันนั้นไม่ต้องการกลยุทธ์ที่จะแตกต่างกัน ความแตกต่างของความเชื่อนั้นเพียงพอที่จะนับเป็นดุลยภาพที่แตกต่างกัน

ความสมดุลที่สมบูรณ์แบบมอบให้โดย: ((D,D,D,D,D),μ1) สำหรับผู้เล่น 1 และ ((D,D,D,D,D),μ2) สำหรับผู้เล่น 2 ที่ไหน μ1 และ μ2 เป็นความเชื่อที่สอดคล้องกันในทุกชุดข้อมูล

ดังที่ได้รับการบันทึกไว้ในความคิดเห็นเนื่องจาก "ข้อบกพร่อง" เป็นกลยุทธ์ที่ครอบงำโดยไม่คำนึงถึงความเชื่อแม้ในความสมดุลแบบเบย์ที่สมบูรณ์แบบที่อ่อนแอโปรไฟล์กลยุทธ์จะต้องเป็น (D,D,D,D,D)สำหรับผู้เล่นทั้งสอง อย่างไรก็ตามต่อไปนี้เป็นความสมดุลแบบเบย์ที่สมบูรณ์แบบของ Bayesian Nash:((D,D,D,D,D),μ1') และ ((D,D,D,D,D),μ2') กับ μ1', μ2' สอดคล้องบนเส้นทางสมดุล

ดังนั้นคำถามไม่ผิดมันก็แสดงให้เห็นว่าสองสมดุล Bayesian แนชที่สมบูรณ์แบบอ่อนแอสามารถมีกลยุทธ์ที่เหมือนกันตราบใดที่พวกเขาแตกต่างกันในความเชื่อออกจากเส้นทางสมดุล

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.