Nash Equilibria ไม่สามารถคำนวณได้โดยทั่วไป -Nash สมดุลคือชุดของกลยุทธ์ที่กำหนดกลยุทธ์ของฝ่ายตรงข้ามแต่ละ Obtains เล่นภายในของผลตอบแทนที่คาดว่าจะเป็นไปได้สูงสุด การหาสมดุลของแนชที่กำหนดและเกมคือ - สมบูรณ์
การทำตามคำจำกัดความอย่างเคร่งครัดดูเหมือนจะไม่มีเหตุผลใดที่จะเชื่อได้ว่ากลยุทธ์ของ -Nash equilibrium ที่ใดก็ตามอยู่ใกล้กับกลยุทธ์ของแนชดุลใด ๆ อย่างไรก็ตามเรามักจะเห็นวรรณกรรมค่อนข้างลื่นไหลใช้วลีเช่น "คำนวณสมดุลแนช" เมื่อมันหมายถึงการพูดว่า "คำนวณสมดุลประมาณแนช"
ดังนั้นฉันสงสัยว่าเมื่อสองหมายถึงแรก; นั่นคือเกมที่เราคาดหวัง -Nash equilibria ว่า "ใกล้" กับ Nash equilibria?
อย่างเป็นทางการมากขึ้นสมมติว่าฉันมีเกมสำหรับผู้เล่นคนและลำดับของโปรไฟล์กลยุทธ์\
แต่ละคือ -Nash ดุลยภาพและลำดับบรรจบกันเป็นศูนย์
คำถามของฉัน:
เมื่อใด (ภายใต้เงื่อนไข / สมมุติฐาน) กลยุทธ์ทั้งหมดมาบรรจบกันเมื่อใด นั่นคือสำหรับผู้เล่นแต่ละคน ,จำเป็นต้องมาบรรจบกัน
ภายใต้เงื่อนไขอะไรเพิ่มเติมขีด จำกัด ของลำดับนี้จริง ๆ แล้วดุลของเกมแนช? (สำหรับฉันแล้วดูเหมือนว่าไม่จำเป็นต้องมีข้อสมมติฐานเพิ่มเติมเช่นหากกลยุทธ์ทั้งหมดมาบรรจบกันขีด จำกัด ควรเป็น NE)
เมื่อใดที่อัลกอริทึมสำหรับการคำนวณ -Nash equilibria จำเป็นต้องมีความหมายถึงอัลกอริธึมสำหรับกลยุทธ์การคำนวณโดยประมาณของสมดุลของแนช? เงื่อนไขข้างต้นเพียงพอหรือไม่
ขอบคุณมาก ๆ!
แก้ไข 2014-03-19
หลังจากอ่านการอ้างอิงในคำตอบของราหุลแล้วมันก็สมเหตุสมผลกว่าที่จะคิดในแง่ของระยะทางระหว่างการแจกแจงมากกว่าการวนเวียนมาบรรจบกัน ดังนั้นฉันจะพยายามใช้ถ้อยคำใหม่อีกครั้งและใส่ความคิดล่าสุด
(ดีนี้เป็นมากเกินไปขั้นตอนวิธีการขึ้นอยู่จริงๆมีคำตอบ. โดยไม่มีข้อ จำกัด ในขั้นตอนวิธีการที่คุณสามารถมีสองสมดุลของแนชที่แตกต่างกันแล้วตามที่คุณเสียบขนาดเล็กและขนาดเล็กเข้าสู่ขั้นตอนวิธีการที่ระยะห่างระหว่างเนื่อง ผลลัพธ์อาจยังคงมีขนาดใหญ่เนื่องจากผลลัพธ์จะแกว่งระหว่างสมดุล)
สมมติว่าเป็นโปรไฟล์กลยุทธ์เช่นการกระจายผลิตภัณฑ์ผ่านกลยุทธ์ของผู้เล่น สำหรับเกมใดที่เราสามารถพูดได้ว่าคือ -Nash equilibrium หมายถึงสำหรับ Nash equilibriumที่เป็น ? (โปรดทราบว่าการสนทนาถือหากการจ่ายเงินถูก จำกัด ด้วย )
นี่เป็นเรื่องยุ่งยากเพราะเราอยู่ในการตั้งค่าความซับซ้อนสิ่งที่เราเรียกว่า "เกม" นั้นจริง ๆ แล้วเป็นลำดับของเกมที่กำหนดพารามิเตอร์โดยจำนวนกลวิธีที่บริสุทธิ์ ("การกระทำ") ดังนั้นที่และอัตราสัมพัทธ์มีความสำคัญ นี่คือตัวอย่างง่ายๆในการแสดงคำตอบไม่ใช่ "ทุกเกม" สมมติว่าเราแก้ไขลำดับของการลด\จากนั้นสำหรับแต่ละเกมสร้างผู้เล่นสองคนในการกระทำโดยที่หากผู้เล่นเล่นการกระทำแรกพวกเขาจะได้รับผลตอบแทนโดยไม่คำนึงถึงสิ่งที่ผู้เล่นคนอื่นเล่น หากผู้เล่นเล่นการกระทำที่สองพวกเขาจะได้รับผลตอบแทนโดยไม่คำนึงถึงสิ่งที่ผู้เล่นคนอื่นเล่น; และหากผู้เล่นเล่นการกระทำอื่นใดพวกเขาจะได้รับผลตอบแทนเป็นโดยไม่คำนึงถึงสิ่งที่ผู้เล่นคนอื่นเล่น
ดังนั้นแต่ละเกมมี -equilibrium (ทั้งสองเล่นแอ็คชั่นที่สอง) ซึ่งอยู่ไกลที่สุดในระยะไกลจากแนชเท่านั้นที่สมดุล (ทั้งคู่เล่นแอคชั่นแรก)
ดังนั้นคำถามย่อยสองคำถามที่น่าสนใจ:
- สำหรับเกมที่ตายตัวและตายตัวไม่ว่าจะเป็น "เล็กพอ"เงื่อนไขดังกล่าวถือ (ทั้งหมด Equilibria อยู่ใกล้กับ Nash equilibria)
- บางทีคำถามเดียวกันเป็นหลัก แต่ไม่ว่าจะอยู่ในสภาพที่ถือถ้าความแตกต่างในผลตอบแทนจะถูกล้อมรอบด้วยคงเป็น\
คำถามเดียวกันกับ (2) แต่เกี่ยวข้องกับดุลยภาพที่คำนวณโดยอัลกอริทึม ฉันเดาว่าบางทีเราอาจจะได้คำตอบอัลกอริธึม / เชิงสร้างสรรค์หรือไม่มีเลยดังนั้นความแตกต่างก็ไม่สำคัญอะไร