การวิเคราะห์เกมการ์ด“ สงคราม” ที่ดัดแปลงแล้ว


13

เกมที่เล่นง่ายโดยเด็ก ๆ เกมแห่งสงครามเล่นโดยคนสองคนโดยใช้ไพ่มาตรฐาน 52 ใบ ในขั้นต้นดาดฟ้าจะถูกสับและไพ่ทั้งหมดจะได้รับการจัดการสองผู้เล่นเพื่อให้แต่ละคนมี 26 บัตรสุ่มในลำดับสุ่ม เราจะสมมติว่าผู้เล่นได้รับอนุญาตให้ตรวจสอบ (แต่ไม่เปลี่ยน) ทั้งสองเด็คเพื่อให้ผู้เล่นแต่ละคนรู้ไพ่และคำสั่งของไพ่ทั้งสองเด็ค โดยทั่วไปแล้วจะมีการจดบันทึกไว้ในทางปฏิบัติ แต่จะไม่เปลี่ยนแปลงอะไรเกี่ยวกับวิธีการเล่นเกมและช่วยรักษาคำถามรุ่นนี้ไว้อย่างสมบูรณ์

จากนั้นผู้เล่นจะเผยไพ่ที่ดีที่สุดจากเด็คตามลำดับ ผู้เล่นที่เปิดเผยไพ่ใบใหญ่กว่า (ตามคำสั่งปกติ: 2, 3, 4, 5, 6, 7, 8, 9, 10, แจ็ค, ราชินี, คิง, เอซ) ชนะการแข่งขันรอบแรกโดยวางไพ่ของเขา ไพ่สูง) ที่ด้านล่างของเด็คของเขาและจากนั้นการ์ดของคู่ต่อสู้ของเขา (การ์ดระดับต่ำ) ที่ด้านล่างของเด็ค (โดยทั่วไปคำสั่งของการ์ดใบนี้จะไม่ถูกบังคับใช้ แต่เพื่อให้รุ่นแรกของคำถามนี้กำหนดขึ้นเช่น การสั่งซื้อจะถูกบังคับใช้)

ในกรณีที่เสมอกันผู้เล่นแต่ละคนจะเปิดเผยไพ่เพิ่มอีกสี่ใบจากด้านบนของเด็ค หากไพ่ใบที่สี่ที่แสดงโดยผู้เล่นคนหนึ่งสูงกว่าไพ่ใบที่สี่ที่แสดงโดยผู้เล่นคนอื่นผู้เล่นที่มีไพ่ใบที่สี่ที่สูงกว่าชนะไพ่ทั้งหมดที่เล่นในระหว่างไทเบรกเกอร์ซึ่งในกรณีนี้ไพ่ของผู้ชนะจะถูกวางไว้ที่ด้านล่าง ผู้ชนะของเด็ค (ในลำดับแรก, ออกก่อน, ในคำอื่น ๆ , การ์ดเก่าจะวางที่ด้านล่างก่อน), ตามด้วยไพ่ของผู้แพ้ (ในลำดับเดียวกัน)

ในกรณีที่มีความสัมพันธ์ที่ตามมากระบวนการซ้ำแล้วซ้ำอีกจนกว่าผู้ชนะของการผูกจะถูกกำหนด หากผู้เล่นคนหนึ่งวิ่งออกมาจากไพ่และไม่สามารถทำลายการผูกผู้เล่นที่ยังคงมีไพ่จะประกาศผู้ชนะ หากผู้เล่นทั้งสองหมดไพ่เพื่อเล่นในเวลาเดียวกันเกมจะประกาศเสมอ

รอบจะเล่นจนกว่าผู้เล่นคนหนึ่งวิ่งออกมาจากไพ่ (กล่าวคือไม่มีไพ่ในสำรับของเขา) ซึ่งเป็นจุดที่ผู้เล่นที่ยังคงมีไพ่ประกาศผู้ชนะ

เมื่อเกมได้รับการอธิบายจนถึงขณะนี้ทั้งทักษะและโชคไม่ได้มีส่วนเกี่ยวข้องในการกำหนดผลลัพธ์ เนื่องจากมีจำนวน จำกัด ของการสับเปลี่ยนของไพ่ 52 ใบมีจำนวน จำกัด ของวิธีการที่ดาดฟ้าอาจจะได้รับการจัดการในขั้นต้นและมันก็เป็นไปตามนั้น (เนื่องจากข้อมูลรัฐเพียงอย่างเดียวในเกมคือสถานะปัจจุบันของชั้นผู้เล่นทั้งสอง ) ผลลัพธ์ของการกำหนดค่าเกมแต่ละรายการสามารถตัดสินได้ก่อน แน่นอนว่ามันเป็นไปได้ที่จะชนะเกมแห่งสงครามและด้วยโทเค็นแบบเดียวกัน นอกจากนี้เรายังเปิดโอกาสที่เกมแห่งสงครามอาจส่งผลให้เกิดการเสมอกันหรือในวงที่ไม่สิ้นสุด สำหรับเวอร์ชั่นที่กำหนดไว้อย่างสมบูรณ์ที่อธิบายไว้ข้างต้นอาจเป็นเช่นนั้นหรือไม่ก็ได้

มีหลายรูปแบบของเกมที่พยายามทำให้มันน่าสนใจยิ่งขึ้น (และไม่ใช่ไม่ใช่ทั้งหมดที่เกี่ยวข้องกับการทำให้มันกลายเป็นเกมการดื่ม) วิธีหนึ่งที่ฉันคิดว่าจะทำให้เกมน่าสนใจยิ่งขึ้นคือการอนุญาตให้ผู้เล่นประกาศ "ปั้น" โดยอัตโนมัติในบางรอบ ในแต่ละรอบผู้เล่น (หรือผู้เล่นทั้งสอง) อาจประกาศว่า "คนดี" หากผู้เล่นคนหนึ่งประกาศ "ทรัมป์" ผู้เล่นคนนั้นจะชนะรอบโดยไม่คำนึงถึงไพ่ที่กำลังเล่นอยู่ หากผู้เล่นทั้งสองประกาศว่า "ทรัมป์" รอบนั้นจะถือว่าเป็นเน็คไทและการเล่นจะดำเนินต่อไป

ใคร ๆ ก็นึกถึงกฎที่หลากหลายที่จำกัดความสามารถของผู้เล่นในการทำทรัมป์ (ไม่ จำกัด ทรัมป์จะส่งผลให้เกมเสมอกัน ฉันเสนอสองเวอร์ชั่น (แค่ส่วนบนสุดของหัวของฉัน; รุ่นที่น่าสนใจกว่าในบรรทัดเหล่านี้น่าจะเป็นไปได้) ของ War ตามแนวคิดนี้

  1. ความถี่สงคราม: ผู้เล่นอาจจะกล้าหาญถ้าพวกเขาไม่ได้กุในรอบก่อนหน้าk
  2. การแก้แค้นของสงคราม: ผู้เล่นอาจจะเป็นเพียงคนที่กล้าหาญถ้าพวกเขาไม่ได้รับรางวัลในรอบก่อนหน้านี้รอบk

ตอนนี้สำหรับคำถามที่ใช้กับแต่ละเวอร์ชันที่อธิบายไว้ข้างต้น:

  1. มีกลยุทธ์เช่นนั้นหรือไม่สำหรับการกำหนดค่าเริ่มต้นของเกมที่เป็นไปได้บางชุดผู้เล่นที่ใช้มันจะเป็นผู้ชนะเสมอ ถ้าเป็นเช่นนั้นกลยุทธ์นี้คืออะไร? ถ้าไม่ทำไมล่ะ
  2. มีกลยุทธ์เช่นนั้นหรือไม่สำหรับการกำหนดค่าเริ่มต้นของเกมบางชุดผู้เล่นที่ใช้มันสามารถชนะหรือบังคับเสมอ (กลยุทธ์การชนะ) ได้หรือไม่? ถ้าเป็นเช่นนั้นกลยุทธ์นี้คืออะไร? ถ้าไม่ทำไมล่ะ
  3. การกำหนดค่าเกมเริ่มต้นของพวกเขาเช่นนั้นไม่มีกลยุทธ์ในการชนะหรือไม่ (เช่นผู้เล่นที่ใช้กลยุทธ์แบบคงที่สามารถเอาชนะได้โดยผู้เล่นที่ใช้กลยุทธ์แบบคงที่ ) หรือไม่? ถ้าใช่พวกเขาคืออะไรและอธิบายได้อย่างไรS SS

เพื่อความชัดเจนฉันคิดว่า "กลยุทธ์" เป็นอัลกอริทึมแบบตายตัวซึ่งกำหนดว่าผู้เล่นที่ใช้กลยุทธ์ควรวนรอบอย่างไร ตัวอย่างเช่นอัลกอริทึม "ทรัมป์ทุกครั้งที่คุณทำได้" เป็นกลยุทธ์และอัลกอริทึม (อัลกอริทึมฮิวริสติก) อีกวิธีที่ฉันขอคือ:

มีการวิเคราะห์พฤติกรรมที่ดี (หรือเหมาะสมที่สุด) ในการเล่นเกมเหล่านี้หรือไม่?

การอ้างอิงถึงการวิเคราะห์ของเกมดังกล่าวได้รับการชื่นชม (ฉันไม่ทราบถึงการวิเคราะห์ของสงครามรุ่นนี้หรือเกมที่เทียบเท่าโดยพื้นฐาน) ผลลัพธ์สำหรับใด ๆนั้นน่าสนใจและชื่นชม (โปรดทราบว่าในทั้งสองกรณีนำไปสู่การดีดไม่ จำกัด ซึ่งฉันได้กล่าวไปแล้ว)k = 0kk=0


นอกจากนี้ยังมีรุ่นอื่น: หากผู้เล่นทั้งสองเล่นทรัมป์กฎจะเป็นปกติ (เช่นชนะการ์ดสูงสุด)
Joe

@Joe ข้อเสนอแนะที่ยอดเยี่ยม! โดยทั่วไปแล้วเวอร์ชั่นสำรองสามารถมีได้ไม่เพียงแค่การเปลี่ยนวิธีที่ผู้เล่นจะได้รับความสามารถในการทรัมป์ แต่ยังเปลี่ยนวิธีการจัดการของผู้เล่นทั้งสองในช่วงเทิร์นเดียวกัน โปรดอย่าลังเลที่จะให้การวิเคราะห์สถานการณ์ที่คุณนำเสนอเช่นกันการวิเคราะห์เช่นนี้จะช่วยในการวิเคราะห์เวอร์ชันที่คล้ายกันอย่างแน่นอน
Patrick87

คำตอบ:


7

หากฉันเข้าใจถูกต้องข้อมูลทั้งหมดเกี่ยวกับเกมจะมีให้สำหรับผู้เล่นทั้งสองคน นั่นคือการกำหนดค่าเริ่มต้นและการเคลื่อนไหวที่เป็นไปได้ทั้งหมดเป็นที่รู้จักกันโดยผู้เล่นทั้งสอง (ส่วนใหญ่เป็นเพราะผู้เล่นทั้งสองสามารถดูไพ่ของผู้เล่นอื่น) ทำให้เกมนี้เป็นเกมที่ไม่มีข้อมูลที่สมบูรณ์แบบ ดังนั้นจึงมีกลยุทธ์ที่สมบูรณ์แบบสำหรับผู้เล่นทั้งสองที่จะบรรลุผลลัพธ์ที่ดีที่สุดในแต่ละเกมสำหรับผู้เล่นคนนั้น สิ่งนี้ได้รับการพิสูจน์ในปี 1912 โดยนักคณิตศาสตร์ชาวเยอรมันชื่อ Ernst Zermelo

ผมไม่ทราบว่าสิ่งที่เป็นกลยุทธ์ แต่สามารถจินตนาการสร้างต้นไม้เกมใหญ่สำหรับมันและการใช้คอมพิวเตอร์เพื่อหากลยุทธ์ที่สำหรับฉันโดยใช้อัลกอริทึมนาทีสูงสุด

ต้นไม้สำหรับแต่ละเกมจะมีรากของมือของผู้เล่นสองคน กิ่งไม้ในต้นไม้สอดคล้องกับการเคลื่อนไหวของผู้เล่น ในกรณีที่ง่ายที่สุดสิ่งเหล่านี้ประกอบด้วยการวางการ์ดที่ต้องการ ในกรณีที่สูงกว่าการย้าย 'ทรัมป์' สามารถทำได้ โหนดภายในของทรีบันทึกสิ่งที่การกำหนดค่าปัจจุบันของการ์ดพร้อมกับข้อมูลใด ๆ เกี่ยวกับสถานะ wrt 'trumps' ใบไม้ของต้นไม้ตรงกับตำแหน่งของเกมท้ายซึ่งจะมีป้ายกำกับว่า +1 สำหรับผู้ชนะ 1, 0 สำหรับการเสมอและ -1 สำหรับผู้ชนะที่ 2 ผู้เล่นไม่สนใจเกมวนรอบในตอนนี้

ตอนนี้อัลกอริทึมขั้นต่ำจะทำงานดังต่อไปนี้ (จากมุมมองของผู้เล่น 1) สมมติว่ามันดูที่โหนดที่ผู้เล่น 1 ทำการย้ายและโหนดด้านล่างนี้มีการเพิ่มความคิดเห็นด้วย +1, 0 หรือ -1 ( ผลตอบแทน) พร้อมกับตัวเลือกที่ผู้เล่นต้องการเพื่อให้ได้ผลลัพธ์ที่กำหนด ผู้เล่น 1 เพียงเลือกโหนดที่มีการจ่ายผลตอบแทนมากที่สุดบันทึกการจ่ายเงินนั้นและตัวเลือกที่จำเป็นในการรับสิ่งนั้น สำหรับโหนดที่ผู้เล่น 2 ทำการเคลื่อนย้ายโหนดที่มีการจ่ายผลตอบแทนขั้นต่ำจะถูกเลือกและตัวเลือกจะถูกบันทึกไว้ นี่สะท้อนให้เห็นว่าผู้เล่น 2 มีเป้าหมายเพื่อให้ได้คะแนนต่ำสุดที่จะชนะ นี่คือการแพร่กระจายไปยังของต้นไม้ ตัวเลือกที่บันทึกไว้ในแต่ละโหนดสอดคล้องกับกลยุทธ์ที่ดีที่สุดที่ผู้เล่นสามารถทำได้ ผลตอบแทนสุดท้ายจะเป็นตัวกำหนดว่าใครจะชนะ ในที่สุดนี่คือฟังก์ชั่นในแง่ของผลตอบแทนแม้ว่าตัวเลือกที่แน่นอนของการเคลื่อนไหวอาจแตกต่างกันไป

การกำหนดค่าการวนลูปที่อาจเกิดขึ้นสามารถรวมเข้ากับแผนผังเกมโดยเพิ่มลูปที่กลับไปยังการกำหนดค่าที่เห็นอยู่แล้ว (เมื่อคำนวณจากด้านบน) สำหรับโหนดดังกล่าวคุณจะได้รับจุดคงที่ที่ยิ่งใหญ่ที่สุดถ้ามันเป็นโหนดที่ผู้เล่น 1 เล่นและจุดคงที่น้อยที่สุดเมื่อผู้เล่น 2 เล่น

โปรดทราบว่าหากคุณไม่ได้ทำการสันนิษฐานว่าผู้เล่นทั้งสองสามารถตรวจสอบสำรับทั้งสองได้วิธีนี้จะไม่นำมาใช้ เกมดังกล่าวจะเกี่ยวข้องกับโอกาสและกลยุทธ์ที่เลือกจะเป็นเกมเฉพาะ

ไม่ว่าจะมีกลยุทธ์การชนะที่แข็งแกร่งหรืออ่อนแอสำหรับผู้เล่นคนใดคนหนึ่งหรือไม่นั้นขึ้นอยู่กับผลลัพธ์ของอัลกอริทึม min-max ที่ใช้กับต้นไม้ทั้งหมด แต่แน่นอนว่ามีจำนวนมาก ... การคำนวณต้นไม้สำหรับหนึ่งอาจเป็นเรื่องง่ายเนื่องจากมีตัวเลือกไม่มากนักในเกม


หลังจากพยายามตอบคำถามนี้ด้วยตัวเองฉันก็รู้ทันทีว่าสิ่งที่คุณชี้ไปคือต้องมีกลยุทธ์ที่ดีที่สุด แต่ในความเป็นจริงการระบุกฎสำหรับกลยุทธ์ดังกล่าวอาจซับซ้อนอย่างไม่น่าเชื่อ มันก็ดูเหมือนว่ามันอาจเป็นไปได้สำหรับผู้เล่นที่จะเข้ามาในทางตันในบางรุ่นของเกมเหล่านี้ ... ซึ่งทั้งคู่สามารถที่จะเป็นคนดี แต่พวกเขาไม่สามารถตกลงกันในสิ่งที่ควรจะเป็นคนที่กล้าหาญ และอีกคนหนึ่งจะกล้าถ้าคนอื่น ๆ จะ) น่าสนใจมาก.
Patrick87
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.