สมดุลย์แบบเบย์ที่สมบูรณ์แบบ

ฉันได้รับคำถามที่ฉันดิ้นรนกับ:

ใช้เกม Dilemma ของ Prisoner's Standard และพิจารณาว่าเล่นสองครั้ง (ผู้เล่นสังเกตผลของเกมแรกก่อนเล่นเกมที่สอง) พิจารณาความเชื่อในแง่ของ node player 2 ที่อยู่ในชุดข้อมูล

ค้นหาความสมดุลย์แบบเบย์ที่สมบูรณ์แบบที่อ่อนแอ (กลยุทธ์และความเชื่อ) ซึ่งกลยุทธ์นั้นไม่ใช่สมดุลที่สมบูรณ์แบบของเกมย่อย

ดังนั้นในภาวะที่กลืนไม่เข้าคายไม่ออกของนักโทษ:

(Defect, Defect) เป็นแนชที่ไม่เหมือนใครและยังเป็นเกมย่อยที่สมบูรณ์แบบไม่เหมือนใคร

แต่เราจะได้สมดุลแบบเบย์ที่สมบูรณ์แบบที่ไม่เกี่ยวข้องกับข้อบกพร่องได้อย่างไร แน่นอนว่าสิ่งนี้มีความโดดเด่นอย่างเคร่งครัด . .

คำถามนี้ผิดหรือเปล่า?

จากนั้นมันก็จะถามหาสมดุล (ซึ่งเราพิจารณาลำดับของกลยุทธ์ต่าง ๆ )

คำถามนี้ผิดหรือฉันเข้าใจผิดแนวคิดเหล่านี้หรือไม่

game-theory bayesian-game

— ไบรอัน
แหล่งที่มา

นั่นไม่ได้เป็นการตอบคำถาม แต่เป็นเพียงจุดให้ความรู้ . . ในความเป็นจริงกลยุทธ์ต้องประกอบด้วย 5 องค์ประกอบ

— Brian

ให้ความคิดเห็นของคุณตอนนี้ฉันคิดว่าปัญหาของคุณอยู่ที่อื่น: หากคุณเลือกกลยุทธ์ที่โดดเด่นในเกมย่อยที่อยู่นอกเส้นทางสมดุล (ดังนั้นสิ่งที่ไม่เกิดขึ้นจริง) ผลตอบแทนของคุณจะไม่ลดลง

— Giskard

ดังนั้นฉันจึงเข้าใจว่าความเชื่อนอกเส้นทางสมดุลอาจเป็นกฎเกณฑ์ (และไม่จำเป็นต้องเป็นไปตามการปรับปรุง Bayesian) แต่ฉันอยู่ภายใต้การแสดงผลที่มีเหตุมีผลตามลำดับต้องถือ (เช่นได้รับความเชื่อเหล่านั้นบุคคลจะต้องเล่น กลยุทธ์ที่ดีที่สุดของพวกเขา) ดังนั้นเพื่อตอบสนองต่อข้อเสนอแนะของคุณกลยุทธ์ที่โดดเด่นจะไม่ละเมิดความเป็นเหตุเป็นผลตามลำดับหรือไม่

— ไบรอัน

@denesp: PBE ที่อ่อนแอนั้น "อ่อนแอ" ไม่ใช่เพราะไม่จำเป็นต้องมีเหตุผลต่อเนื่องออกจากเส้นทางที่สมดุล แต่เพราะมันไม่ต้องการความเชื่อที่จะสอดคล้องกับ Bayes ออกกฎเส้นทางสมดุล ในขณะที่ฉันยอมรับว่าในกรณีของภาวะที่กลืนไม่เข้าคายไม่ออกของนักโทษซ้ำสองครั้ง (PD) ไม่มี WPBE ที่ไม่มีกลยุทธ์สมบูรณ์แบบที่ไม่ใช่ subgame ข้อสรุปนี้ไม่ได้ถือโดยทั่วไป เหตุผลก็คือเนื่องจากข้อบกพร่องเป็นกลยุทธ์ที่มีอิทธิพลอย่างยิ่งใน PD ดังนั้นสำหรับความเชื่อใด ๆ ออกจากเส้นทางสมดุล (แม้ว่าจะไม่สอดคล้องกับกฎของ Bayes) ข้อบกพร่องยังคงมีเหตุผลตามลำดับ

— Herr K.

อย่างไรก็ตามสำหรับเกมที่ไม่มีกลยุทธ์ที่โดดเด่นเราสามารถจัดการกับความเชื่อในความสมดุลในวิธีที่จะทำให้กลยุทธ์ที่สมบูรณ์แบบที่ไม่ใช่เกมย่อยให้มีเหตุผลตามลำดับ หากเราเสริมความแข็งแกร่งให้สอดคล้องกับความเชื่อ (เช่นจำเป็นในดุลยภาพตามลำดับ) โดยบังคับให้เบย์ออกกฎเพื่อหยุดยั้งความสมดุลจากนั้นเราสามารถแยกกลวิธีที่สมบูรณ์แบบที่ไม่ใช่เกมย่อย ดังนั้นเราจึงมีผลลัพธ์ที่สมดุลตามลำดับแสดงถึงทั้ง WPBE และ SPE

— Herr K.

ปล่อยให้กลยุทธ์ของผู้เล่น 1 ถูกแทนด้วย $(x1_1,xDD_1,xDC_1,xCD_1,xCC_1)$ ที่ไหน $x1$ เป็นการกระทำรอบแรกของผู้เล่น 1 $xDD_1$ เป็นการกระทำที่เกิดขึ้นในชุดข้อมูลซึ่งผู้เล่นทั้งสองเสียในรอบแรก $xDC_1$ เป็นการกระทำที่ชุดข้อมูลซึ่งผู้เล่น 1 เสียและผู้เล่น 2 ร่วมมือในรอบที่ 1 เป็นต้นโปรดทราบว่าสิ่งที่ชอบ $(x1_1,x2_1)$ (กับ $x2_1$ การกระทำที่เกิดขึ้นในรอบที่ 2) ไม่ได้เป็นข้อกำหนดเฉพาะของกลยุทธ์ของผู้เล่น 1 เนื่องจากเราจำเป็นต้องระบุพฤติกรรมในแต่ละชุดข้อมูลแยกจากกัน กำหนดกลยุทธ์ของผู้เล่น 2 ในทำนองเดียวกัน อย่างไรก็ตามความสมดุลแบบเบย์ที่สมบูรณ์แบบนั้นต้องระบุความเชื่อของผู้เล่นด้วย $\mu_1,\mu_2$ . นี่เป็นส่วนสำคัญของการกำหนดดุลยภาพ ดังที่เราจะเห็นด้านล่างคำถามนั้นมุ่งไปสู่การทำความเข้าใจว่าสมดุลที่แตกต่างกันนั้นไม่ต้องการกลยุทธ์ที่จะแตกต่างกัน ความแตกต่างของความเชื่อนั้นเพียงพอที่จะนับเป็นดุลยภาพที่แตกต่างกัน

ความสมดุลที่สมบูรณ์แบบมอบให้โดย: $((D,D,D,D,D),\mu_1)$ สำหรับผู้เล่น 1 และ $((D,D,D,D,D),\mu_2)$ สำหรับผู้เล่น 2 ที่ไหน $\mu_1$ และ $\mu_2$ เป็นความเชื่อที่สอดคล้องกันในทุกชุดข้อมูล

ดังที่ได้รับการบันทึกไว้ในความคิดเห็นเนื่องจาก "ข้อบกพร่อง" เป็นกลยุทธ์ที่ครอบงำโดยไม่คำนึงถึงความเชื่อแม้ในความสมดุลแบบเบย์ที่สมบูรณ์แบบที่อ่อนแอโปรไฟล์กลยุทธ์จะต้องเป็น $(D,D,D,D,D)$ สำหรับผู้เล่นทั้งสอง อย่างไรก็ตามต่อไปนี้เป็นความสมดุลแบบเบย์ที่สมบูรณ์แบบของ Bayesian Nash: $((D,D,D,D,D),\mu_1')$ และ $((D,D,D,D,D),\mu_2')$ กับ $\mu_1'$ , $\mu_2'$ สอดคล้องบนเส้นทางสมดุล

ดังนั้นคำถามไม่ผิดมันก็แสดงให้เห็นว่าสองสมดุล Bayesian แนชที่สมบูรณ์แบบอ่อนแอสามารถมีกลยุทธ์ที่เหมือนกันตราบใดที่พวกเขาแตกต่างกันในความเชื่อออกจากเส้นทางสมดุล

— HRSE
แหล่งที่มา