เมื่อใดที่ -Nash กลยุทธ์ดุลยภาพมาบรรจบกับกลยุทธ์ Nash Equilibrium?


9

Nash Equilibria ไม่สามารถคำนวณได้โดยทั่วไป -Nash สมดุลคือชุดของกลยุทธ์ที่กำหนดกลยุทธ์ของฝ่ายตรงข้ามแต่ละ Obtains เล่นภายในของผลตอบแทนที่คาดว่าจะเป็นไปได้สูงสุด การหาสมดุลของแนชที่กำหนดและเกมคือ - สมบูรณ์ϵϵϵϵPPAD

การทำตามคำจำกัดความอย่างเคร่งครัดดูเหมือนจะไม่มีเหตุผลใดที่จะเชื่อได้ว่ากลยุทธ์ของ -Nash equilibrium ที่ใดก็ตามอยู่ใกล้กับกลยุทธ์ของแนชดุลใด ๆ อย่างไรก็ตามเรามักจะเห็นวรรณกรรมค่อนข้างลื่นไหลใช้วลีเช่น "คำนวณสมดุลแนช" เมื่อมันหมายถึงการพูดว่า "คำนวณสมดุลประมาณแนช"ϵ

ดังนั้นฉันสงสัยว่าเมื่อสองหมายถึงแรก; นั่นคือเกมที่เราคาดหวัง -Nash equilibria ว่า "ใกล้" กับ Nash equilibria?ϵ


อย่างเป็นทางการมากขึ้นสมมติว่าฉันมีเกมสำหรับผู้เล่นคนและลำดับของโปรไฟล์กลยุทธ์\n(s1(1),,sn(1)),(s1(2),,sn(2)),(s1(3),,sn(3)),

แต่ละคือ -Nash ดุลยภาพและลำดับบรรจบกันเป็นศูนย์(s1(i),,sn(i))ϵiϵ1,ϵ2,ϵ3,

คำถามของฉัน:

  1. เมื่อใด (ภายใต้เงื่อนไข / สมมุติฐาน) กลยุทธ์ทั้งหมดมาบรรจบกันเมื่อใด นั่นคือสำหรับผู้เล่นแต่ละคน ,จำเป็นต้องมาบรรจบกันjsj(1),sj(2),sj(3),

  2. ภายใต้เงื่อนไขอะไรเพิ่มเติมขีด จำกัด ของลำดับนี้จริง ๆ แล้วดุลของเกมแนช? (สำหรับฉันแล้วดูเหมือนว่าไม่จำเป็นต้องมีข้อสมมติฐานเพิ่มเติมเช่นหากกลยุทธ์ทั้งหมดมาบรรจบกันขีด จำกัด ควรเป็น NE)

  3. เมื่อใดที่อัลกอริทึมสำหรับการคำนวณ -Nash equilibria จำเป็นต้องมีความหมายถึงอัลกอริธึมสำหรับกลยุทธ์การคำนวณโดยประมาณของสมดุลของแนช? เงื่อนไขข้างต้นเพียงพอหรือไม่ϵ

ขอบคุณมาก ๆ!


แก้ไข 2014-03-19

หลังจากอ่านการอ้างอิงในคำตอบของราหุลแล้วมันก็สมเหตุสมผลกว่าที่จะคิดในแง่ของระยะทางระหว่างการแจกแจงมากกว่าการวนเวียนมาบรรจบกัน ดังนั้นฉันจะพยายามใช้ถ้อยคำใหม่อีกครั้งและใส่ความคิดล่าสุด1

  1. (ดีนี้เป็นมากเกินไปขั้นตอนวิธีการขึ้นอยู่จริงๆมีคำตอบ. โดยไม่มีข้อ จำกัด ในขั้นตอนวิธีการที่คุณสามารถมีสองสมดุลของแนชที่แตกต่างกันแล้วตามที่คุณเสียบขนาดเล็กและขนาดเล็กเข้าสู่ขั้นตอนวิธีการที่ระยะห่างระหว่างเนื่อง ผลลัพธ์อาจยังคงมีขนาดใหญ่เนื่องจากผลลัพธ์จะแกว่งระหว่างสมดุล)ϵ1

  2. สมมติว่าเป็นโปรไฟล์กลยุทธ์เช่นการกระจายผลิตภัณฑ์ผ่านกลยุทธ์ของผู้เล่น สำหรับเกมใดที่เราสามารถพูดได้ว่าคือ -Nash equilibrium หมายถึงสำหรับ Nash equilibriumที่เป็น ? (โปรดทราบว่าการสนทนาถือหากการจ่ายเงินถูก จำกัด ด้วย )ppϵpq1δqδ0ϵ01

    นี่เป็นเรื่องยุ่งยากเพราะเราอยู่ในการตั้งค่าความซับซ้อนสิ่งที่เราเรียกว่า "เกม" นั้นจริง ๆ แล้วเป็นลำดับของเกมที่กำหนดพารามิเตอร์โดยจำนวนกลวิธีที่บริสุทธิ์ ("การกระทำ") ดังนั้นที่และอัตราสัมพัทธ์มีความสำคัญ นี่คือตัวอย่างง่ายๆในการแสดงคำตอบไม่ใช่ "ทุกเกม" สมมติว่าเราแก้ไขลำดับของการลด\จากนั้นสำหรับแต่ละเกมสร้างผู้เล่นสองคนในการกระทำโดยที่หากผู้เล่นเล่นการกระทำแรกพวกเขาจะได้รับผลตอบแทนโดยไม่คำนึงถึงสิ่งที่ผู้เล่นคนอื่นเล่น หากผู้เล่นเล่นการกระทำที่สองพวกเขาจะได้รับผลตอบแทนnnϵ0ϵ1,ϵ2,ϵnn11ϵnโดยไม่คำนึงถึงสิ่งที่ผู้เล่นคนอื่นเล่น; และหากผู้เล่นเล่นการกระทำอื่นใดพวกเขาจะได้รับผลตอบแทนเป็นโดยไม่คำนึงถึงสิ่งที่ผู้เล่นคนอื่นเล่น0

    ดังนั้นแต่ละเกมมี -equilibrium (ทั้งสองเล่นแอ็คชั่นที่สอง) ซึ่งอยู่ไกลที่สุดในระยะไกลจากแนชเท่านั้นที่สมดุล (ทั้งคู่เล่นแอคชั่นแรก)nϵn1

    ดังนั้นคำถามย่อยสองคำถามที่น่าสนใจ:

    1. สำหรับเกมที่ตายตัวและตายตัวไม่ว่าจะเป็น "เล็กพอ"เงื่อนไขดังกล่าวถือ (ทั้งหมด Equilibria อยู่ใกล้กับ Nash equilibria)nϵϵ
    2. บางทีคำถามเดียวกันเป็นหลัก แต่ไม่ว่าจะอยู่ในสภาพที่ถือถ้าความแตกต่างในผลตอบแทนจะถูกล้อมรอบด้วยคงเป็น\n
  3. คำถามเดียวกันกับ (2) แต่เกี่ยวข้องกับดุลยภาพที่คำนวณโดยอัลกอริทึม ฉันเดาว่าบางทีเราอาจจะได้คำตอบอัลกอริธึม / เชิงสร้างสรรค์หรือไม่มีเลยดังนั้นความแตกต่างก็ไม่สำคัญอะไร


มีจุด จำกัด เสมอซึ่งลำดับย่อยของ epsilon-equilibria มาบรรจบกันและขีด จำกัด นี้จะเป็นดุลยภาพแนชที่แท้จริง สิ่งนี้แสดงถึงความกะทัดรัดของพื้นที่ของโปรไฟล์กลยุทธ์แบบผสมและความต่อเนื่องของฟังก์ชันยูทิลิตี้ในฐานะฟังก์ชันของความน่าจะเป็นของกลยุทธ์แบบผสม (s1...sn)
โนม

คำตอบ:


5

กระดาษต่อไปนี้อย่างน้อยเป็นทางการทำให้แนวคิดเรื่องความสมดุลโดยประมาณใกล้เคียงกับความสมดุลที่แน่นอนและพิสูจน์ผลลัพธ์เชิงโครงสร้างที่เกี่ยวข้อง

Pranjal Awasthi, Maria-Florina Balcan, Avrim Blum, หรือ Sheffet และ Santosh Vempala (2010) ใน Nash สมดุลของเกมที่มีความเสถียรโดยประมาณ ในการประชุมนานาชาติครั้งที่สามเรื่องทฤษฎีเกมอัลกอริทึม (SAGT'10), 78-89

โดยเฉพาะอย่างยิ่งกระดาษให้ตัวอย่างของคลาสของเกมสำหรับคำถาม 3


ขอบคุณ! ฉันเดาว่านี่คือสถานะของศิลปะ ฉันจะเพิ่มความคิดในคำถามของฉันเช่นกัน
usul
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.