พิจารณาเกมที่มีผู้เล่น 2 คนดังต่อไปนี้:
- ธรรมชาติสุ่มเลือกโปรแกรม
- ผู้เล่นแต่ละคนเล่นหมายเลขใน [0, อินฟินิตี้] รวมเพื่อตอบสนองต่อการเคลื่อนไหวของธรรมชาติ
- ใช้จำนวนขั้นต่ำของผู้เล่นและเรียกใช้โปรแกรมสำหรับ (ไม่เกิน) ว่าหลายขั้นตอน (ยกเว้นว่าผู้เล่นทั้งคู่เลือกอินฟินิตี้)
- หากโปรแกรมหยุดทำงานผู้เล่นที่เล่นหมายเลขต่ำสุดจะได้รับ 1 แต้ม หากโปรแกรมไม่หยุดผู้เล่นคนนั้นจะเสีย 1 คะแนน ผู้เล่นที่เล่นเป็นจำนวนไม่น้อยได้รับ 0 คะแนนและผู้เล่นทั้งสองได้รับ 0 ถ้าพวกเขาเล่นอนันต์
(กรณีมุมอาจได้รับการจัดการด้วยวิธีใดก็ตามที่รักษาจิตวิญญาณของปัญหาได้ดีที่สุด - เช่นความหมายกึ่งอัตโนมัติตอนบนอาจเป็นประโยชน์)
คำถาม: เกมนี้มีสมดุลของแนชที่คำนวณได้หรือไม่?
หากไม่มีข้อกำหนดการคำนวณผู้เล่นแต่ละคนจะเล่นตามจำนวนขั้นตอนที่แน่นอนซึ่งโปรแกรมหยุด (หรือไม่มีที่สิ้นสุดหากไม่หยุด)
หากคุณลองโต้แย้งตามแนวทแยงมุมตามปกติสำหรับปัญหาการหยุดพักคุณจะพบว่ามีความสมดุลในกลยุทธ์ที่หลากหลายดังนั้นวิธีการที่ชัดเจนจึงไม่สามารถใช้งานได้ทันที อาจจะมีวิธีการปรับแต่งบางอย่าง?
ในทางตรงกันข้ามความเท่าเทียมกันของสนามปิดจริงหมายความว่าเกมที่ จำกัด ด้วยการจ่ายผลตอบแทนที่คำนวณได้มีความสมดุลที่คำนวณได้ เกมนี้ไม่ได้ จำกัด แต่พื้นที่กลยุทธ์ถูกปิดและการคำนวณผลตอบแทนดังนั้นอาจใช้เล่ห์เหลี่ยมเดียวกันกับทฤษฎีบทของ Glicksberg หรือบางสิ่งในเส้นเลือดนั้น? ปัญหาคือหากไม่มีความต้องการในการคำนวณความสมดุลอยู่ในกลยุทธ์ที่บริสุทธิ์ดังนั้นความพยายามใด ๆ ที่จะพิสูจน์การมีอยู่ของความสมดุลที่คำนวณได้โดยใช้การดำรงอยู่ของความสมดุลที่คำนวณได้อาจจะต้องอธิบายว่าทำไมสมดุลถูกลดระดับจากบริสุทธิ์
ดูเหมือนว่าจะเป็นปัญหาที่ผู้คนอาจไม่เคยตอบคำถามนี้มาก่อน แต่อาจมองสิ่งที่คล้ายกัน ฉันไม่สามารถพลิกผันได้มากนัก แต่ถ้าใครรู้เรื่องของวิญญาณกรุณาแจ้งให้เราทราบ!
แรงจูงใจ: มีปรีชาญาณทั่วไปที่การอ้างอิงตนเองเป็นบล็อกหลักในการคำนวณ - นั่นคือปัญหาใด ๆ ที่ไม่สามารถคำนวณได้ใด ๆ ก็ฝังการอ้างอิงตนเอง หากเกมแบบนี้มีความสมดุลของแนชที่คำนวณได้มันจะแสดงหลักฐานสำหรับสัญชาตญาณว่า
UPDATE: เพื่อชี้แจงความสมดุลควรเป็น "คำนวณ" ในแง่ของจำนวนจริงคำนวณ: ความน่าจะเป็นที่อธิบายการกระจายกลยุทธ์ผสมควรคำนวณได้เพื่อความแม่นยำโดยพลการ (โปรดทราบว่ามีเพียงความน่าจะเป็นจำนวน จำกัด เท่านั้นที่จะอยู่เหนือระดับความแม่นยำใด ๆ ) ซึ่งหมายความว่าเราสามารถสุ่มตัวอย่างจากการประมาณโดยพลการของกลยุทธ์ดุลยภาพ