ความสมดุลในเกมที่หยุดชะงัก


10

พิจารณาเกมที่มีผู้เล่น 2 คนดังต่อไปนี้:

  • ธรรมชาติสุ่มเลือกโปรแกรม
  • ผู้เล่นแต่ละคนเล่นหมายเลขใน [0, อินฟินิตี้] รวมเพื่อตอบสนองต่อการเคลื่อนไหวของธรรมชาติ
  • ใช้จำนวนขั้นต่ำของผู้เล่นและเรียกใช้โปรแกรมสำหรับ (ไม่เกิน) ว่าหลายขั้นตอน (ยกเว้นว่าผู้เล่นทั้งคู่เลือกอินฟินิตี้)
  • หากโปรแกรมหยุดทำงานผู้เล่นที่เล่นหมายเลขต่ำสุดจะได้รับ 1 แต้ม หากโปรแกรมไม่หยุดผู้เล่นคนนั้นจะเสีย 1 คะแนน ผู้เล่นที่เล่นเป็นจำนวนไม่น้อยได้รับ 0 คะแนนและผู้เล่นทั้งสองได้รับ 0 ถ้าพวกเขาเล่นอนันต์

(กรณีมุมอาจได้รับการจัดการด้วยวิธีใดก็ตามที่รักษาจิตวิญญาณของปัญหาได้ดีที่สุด - เช่นความหมายกึ่งอัตโนมัติตอนบนอาจเป็นประโยชน์)

คำถาม: เกมนี้มีสมดุลของแนชที่คำนวณได้หรือไม่?

หากไม่มีข้อกำหนดการคำนวณผู้เล่นแต่ละคนจะเล่นตามจำนวนขั้นตอนที่แน่นอนซึ่งโปรแกรมหยุด (หรือไม่มีที่สิ้นสุดหากไม่หยุด)

หากคุณลองโต้แย้งตามแนวทแยงมุมตามปกติสำหรับปัญหาการหยุดพักคุณจะพบว่ามีความสมดุลในกลยุทธ์ที่หลากหลายดังนั้นวิธีการที่ชัดเจนจึงไม่สามารถใช้งานได้ทันที อาจจะมีวิธีการปรับแต่งบางอย่าง?

ในทางตรงกันข้ามความเท่าเทียมกันของสนามปิดจริงหมายความว่าเกมที่ จำกัด ด้วยการจ่ายผลตอบแทนที่คำนวณได้มีความสมดุลที่คำนวณได้ เกมนี้ไม่ได้ จำกัด แต่พื้นที่กลยุทธ์ถูกปิดและการคำนวณผลตอบแทนดังนั้นอาจใช้เล่ห์เหลี่ยมเดียวกันกับทฤษฎีบทของ Glicksberg หรือบางสิ่งในเส้นเลือดนั้น? ปัญหาคือหากไม่มีความต้องการในการคำนวณความสมดุลอยู่ในกลยุทธ์ที่บริสุทธิ์ดังนั้นความพยายามใด ๆ ที่จะพิสูจน์การมีอยู่ของความสมดุลที่คำนวณได้โดยใช้การดำรงอยู่ของความสมดุลที่คำนวณได้อาจจะต้องอธิบายว่าทำไมสมดุลถูกลดระดับจากบริสุทธิ์

ดูเหมือนว่าจะเป็นปัญหาที่ผู้คนอาจไม่เคยตอบคำถามนี้มาก่อน แต่อาจมองสิ่งที่คล้ายกัน ฉันไม่สามารถพลิกผันได้มากนัก แต่ถ้าใครรู้เรื่องของวิญญาณกรุณาแจ้งให้เราทราบ!

แรงจูงใจ: มีปรีชาญาณทั่วไปที่การอ้างอิงตนเองเป็นบล็อกหลักในการคำนวณ - นั่นคือปัญหาใด ๆ ที่ไม่สามารถคำนวณได้ใด ๆ ก็ฝังการอ้างอิงตนเอง หากเกมแบบนี้มีความสมดุลของแนชที่คำนวณได้มันจะแสดงหลักฐานสำหรับสัญชาตญาณว่า

UPDATE: เพื่อชี้แจงความสมดุลควรเป็น "คำนวณ" ในแง่ของจำนวนจริงคำนวณ: ความน่าจะเป็นที่อธิบายการกระจายกลยุทธ์ผสมควรคำนวณได้เพื่อความแม่นยำโดยพลการ (โปรดทราบว่ามีเพียงความน่าจะเป็นจำนวน จำกัด เท่านั้นที่จะอยู่เหนือระดับความแม่นยำใด ๆ ) ซึ่งหมายความว่าเราสามารถสุ่มตัวอย่างจากการประมาณโดยพลการของกลยุทธ์ดุลยภาพ


การอัปเดตของคุณเกี่ยวข้องกับการเล่นเป็นตัวเลขจริงหรือไม่ (กล่าวคือพวกเขาสามารถเล่นกับความน่าจะจำนวน 1 โดยไม่ทราบว่าหรือไม่ว่าจำนวนเป็นอินฟินิตี้?)

เราได้รับอนุญาตให้รู้จักการกระจายของคู่ต่อสู้หรือไม่?
Bjørn Kjos-Hanssen

Ricky: บทละครอาจถือได้ว่าเป็น reals ที่คำนวณได้ แต่การตัดทอนให้เป็นจำนวนเต็มควรควบคุมการเล่นที่ไม่ จำกัด จำนวนเต็มใด ๆ เนื่องจากโปรแกรมจะทำงานตามจำนวนขั้นตอน (หรือไม่สิ้นสุด) เท่านั้น ฉันไม่แน่ใจว่าฉันเข้าใจตัวอย่างวงเล็บปีกกาของคุณหรือไม่ดังนั้นฉันอาจเข้าใจผิดคำถามของคุณ
John Wentworth

Bjørn: ใช่ ถือว่าการกระจายของธรรมชาติเป็นที่รู้จักและวางน้ำหนักที่ไม่ใช่ศูนย์ในโปรแกรมที่ถูกต้องทั้งหมด สมมติว่าผู้เล่นแต่ละคนรู้กลยุทธ์ของผู้เล่นคนอื่น (เช่นการกระจาย)
John Wentworth

@johnwentworth ใช้ @ หรือไม่เห็นการตอบกลับของคุณ
rus9384

คำตอบ:


11

1/2ผมผมเสื้อJเสื้อJJเสื้อ


ฉันชอบสิ่งก่อสร้างนี้ - มันกำหนดว่าสมดุลใด ๆ ของแนชต้องเล่นอย่างถูกต้องสำหรับโปรแกรมทั้งหมด มีขั้นตอนเพิ่มเติมที่จำเป็นในการสร้างว่าจะแก้ปัญหาการหยุดเนื่องจากการกระจายจะต้องมาบรรจบกันเพื่อประสิทธิภาพที่สมบูรณ์แบบในขีด จำกัด ของความแม่นยำสูง (และการคำนวณที่ไม่มีที่สิ้นสุด) เนื่องจากเรารู้ว่าผลลัพธ์จะต้องใส่น้ำหนักหน่วยเป็นจำนวนเต็มหนึ่งฉันคิดว่ามันพอเพียงในการคำนวณความน่าจะเป็นของกลยุทธ์ภายใน 1/4 และจากนั้นใช้จำนวนเต็มใดก็ตามที่มีน้ำหนักมากกว่า 1/2
John Wentworth
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.