Elo ของโปรแกรมคอมพิวเตอร์ที่เล่นแบบสุ่มจะเป็นอย่างไร
เพื่อความเรียบง่ายสมมติว่าเขาไม่เคยขอให้เสมอหรือลาออกและไม่รับข้อเสนอการจับสลาก
Elo ของโปรแกรมคอมพิวเตอร์ที่เล่นแบบสุ่มจะเป็นอย่างไร
เพื่อความเรียบง่ายสมมติว่าเขาไม่เคยขอให้เสมอหรือลาออกและไม่รับข้อเสนอการจับสลาก
คำตอบ:
ที่ด้านล่างสุดของรายชื่อการจัดอันดับหมากรุกคอมพิวเตอร์สำหรับการควบคุมเวลา 40/4 คือ Brutus RND เครื่องมือที่เลือกการเคลื่อนไหวทางกฎหมายแบบสุ่ม
มันมีการจัดอันดับที่ 205 (ณ 6/6/2018) นี่ไม่ใช่การให้คะแนนโดยสุจริต แต่ใช้ระบบ Elo
มันชนะ 0, 242 ขาดทุนและ 64 เสมอ การจับฉลากเกิดจากโปรแกรมผิดพลาดที่ทำให้เกิดการดึงซ้ำโดยบังเอิญหรือเป็นครั้งคราวจนมุมแม้ว่าพวกเขามักจะมีข้อได้เปรียบที่สำคัญเมื่อเกิดเหตุการณ์นี้
สุจริตมีระดับการให้คะแนน 1,000 Brutus RND ก็จะล้มเหลวในการสร้างการจัดอันดับที่สูงและจะไม่มีการจัดอันดับ
หากเราเพิกเฉยชั้นเรตติ้งโดยสุจริตก็เป็นไปได้ที่จะมีเรตติ้งติดลบภายใต้ระบบ Elo
สิ่งหนึ่งที่พูดถึงคือ FIDE ใช้ตารางเพื่อคำนวณการเปลี่ยนแปลงการจัดอันดับและหากความแตกต่างของการจัดอันดับมากกว่า 735 จะไม่มีการเปลี่ยนแปลงเกิดขึ้นเมื่อผู้เล่นที่แข็งแกร่งชนะ นั่นหมายความว่าบรูตัสไม่เคยมีคะแนน -5000 หรืออะไรทำนองนั้นเพราะมันจะต้องเสียคะแนนให้กับผู้เล่นที่ไร้ความสามารถที่น่าทึ่งซึ่งจะไม่สามารถส่งผู้รุกฆาตได้
https://www.fide.com/component/handbook/?view=article&id=197
เราคาดเดาได้ที่นี่ ผู้เล่น 1,000 คนที่ได้รับคะแนน Elo จะสามารถรับการจัดอันดับของ Brutus ได้ที่ 265 แต่เนื่องจากไม่มีผู้เล่นที่มีอันดับแย่กว่าเราจึงไม่สามารถบอกได้เลยว่าพวกเขาจะสามารถลดอันดับของ Brutus ลงได้อีกหากพวกเขามีอยู่จริง
ฉันเดาว่าผู้เล่นที่มี 500 Elo หรือแย่กว่านั้นจะมีปัญหาในการส่งเพื่อนอย่างสม่ำเสมอเช่นเดียวกับโปรแกรมที่ผิดพลาด วาดโดยการทำซ้ำ 3 เท่าหรือกฎการย้าย 50 ครั้งไม่ได้เป็นไปโดยอัตโนมัติภายใต้กฎ FIDE และจะเกิดขึ้นก็ต่อเมื่อ Brutus อ้างสิทธิ์พวกเขา แต่มนุษย์อาจสูญเสียไปเมื่อเวลาผ่านไปนานพอ ๆ กับการวาดโดยไม่ตั้งใจ
ดังนั้นฉันคาดเดาบางแห่งในช่วง -200 ถึง 200 ถ้า FIDE อนุญาตให้มีการให้คะแนนต่ำกว่า 1,000 และอนุญาตให้ Brutus แข่งขันได้
ปัญหาเกี่ยวกับการเล่นแบบสุ่มคือในตำแหน่งหมากรุกโดยเฉลี่ยมีการเคลื่อนไหวมากมาย (จาก 20 ในการเปิดไปสู่ endgames ที่ซับซ้อน 50 เกมหรือมากกว่านั้น) แต่มีเพียงไม่กี่คนเท่านั้นที่ยอมรับได้ การเคลื่อนไหวแบบสุ่มจะส่งผลให้เกิดการไม่ประสานกันอย่างสมบูรณ์ตั้งแต่เริ่มต้นเกม ยิ่งกว่านั้นการจับชิ้นส่วนที่มีค่าน้อยจะเป็นเรื่องธรรมดามากโดยเฉพาะในเกมกลาง สิ่งนี้กล่าวว่าแม้จะมีการต่อต้านที่อ่อนแอมากคอมพิวเตอร์ก็จะทำผิดพลาดในระยะยาว: มีการซื้อขายวัตถุดิบจำนวนมากและอาจไม่ดีสำหรับคอมพิวเตอร์มากนักคอมพิวเตอร์จะไม่ได้รับการพัฒนาอย่างไม่ต้องสงสัยราชาของเขาจะไม่ปลอดภัยและ อาจไม่ได้ถูกปราสาท ...
สิ่งเลวร้ายมากมายที่ซ้อนกันและเร็วมากจะส่งผลให้เกิดความพ่ายแพ้อย่างแน่นอนสำหรับเครื่องจักร Elo ของเขาอาจจะเป็น 0 สุจริต
การเล่นแบบสุ่มที่แท้จริงนั้นแย่กว่าที่คุณคิด ชั้นสัมบูรณ์ USCF คือ 100 และโปรแกรมนี้จะไม่สูงไปกว่านั้น
ผมไม่แน่ใจว่าวิธีการจัดอันดับไปเปรียบเทียบกับหมากรุก แต่เล่นแบบสุ่มเป็นเรื่องเกี่ยวกับ -3500 มี เนื่องจากปัจจัยการแยกตัวของหมากรุกต่ำกว่าฉันคาดหวังว่าผู้เล่นอีโลแบบสุ่มจะสูงกว่าอาจอยู่ระหว่าง -2000 ถึง -500
เลวร้ายยิ่งกว่าแน่นอนเริ่มที่แทบจะรู้กฎของเกมเพราะอย่างน้อยการเริ่มต้นที่จะทำให้บางคนคิดเข้าสู่การเลือกย้าย การเคลื่อนไหวของพวกเขาอาจจะยังคงสุ่มเป็นส่วนใหญ่ แต่อย่างน้อยก็มีการประเมินตำแหน่งที่เกิดขึ้น
ดังนั้นการจัดอันดับของเครื่องยนต์นี้จะอยู่ที่ชั้นล่างสุดของระบบการให้คะแนนที่คุณเลือก ในที่สุดมันอาจจะชนะหรือวาดเกมกับคู่ต่อสู้ที่ไม่เท่าเทียมกันและเพิ่มขึ้นอีกสองสามคะแนน อย่างไรก็ตามคุณสามารถคาดหวังว่าเครื่องยนต์จะจมลงสู่พื้นอย่างรวดเร็วในภายหลัง
"การเขียนโปรแกรมคอมพิวเตอร์เพื่อเล่นหมากรุก" ในแชนนอนเขาตั้งข้อสังเกตว่าความน่าจะเป็นของการเล่นแบบสุ่มเต้นบอทวินนิคนั้นมีค่า 10 ถึง -75 ดังนั้นหากคอมพิวเตอร์แบบสุ่มนี้เล่นบอทวินนิก (หรือแม้แต่นายปรมาจารย์ประจำ) ไม่หยุดยั้งสำหรับชีวิตมนุษย์เราสามารถคาดหวังได้ว่าจะไม่มีวันชนะ
อย่างไรก็ตามแชนนอนกล่าวต่อไปว่าการเล่นแบบสุ่มไม่ใช่กลยุทธ์ที่แย่ที่สุด กลยุทธ์ที่เลวร้ายที่สุดคือจงใจเล่นท่าที่ช่วยเหลือคู่ต่อสู้ ในขณะที่เป็นไปได้ผู้เริ่มต้นที่สมบูรณ์สามารถทำเช่นนี้ได้โอกาสที่พวกเขาจะลองเล่นท่าที่ปรับปรุงตำแหน่งของตนเอง
คำตอบที่ดีมากคือทำสิ่งนี้:
ใช้ numpy เอ็นจิ้นเกมที่อ่อนแอมาก ๆ 1500 ELO หรือมากกว่านั้นและแนบสคริปต์ไพ ธ อน มีห้องสมุดมากมายที่ให้การเคลื่อนไหวที่เป็นไปได้ในตำแหน่งดังนั้นเราสามารถสุ่มเลือกได้ ฉันจะโพสต์ผลลัพธ์ในภายหลัง
http://creative-co.de/random_chess/
คุณควรตรวจสอบสิ่งนี้ด้วย