ผู้เล่นที่แข็งแกร่งย้ายชิ้นส่วนของตนด้วยความถี่สัมพัทธ์ที่แตกต่างจากผู้เล่นที่อ่อนแอ


24

คำถามนี้เป็นจุดเริ่มต้นของ Ramon Snir รุ่นก่อนหน้าเกี่ยวกับการเคลื่อนย้ายชิ้นส่วนที่แตกต่างกันโดยเฉลี่ยในเกมหมากรุก คำถามของฉัน:

จำนวนสัมพัทธ์ของการเคลื่อนไหวสำหรับชิ้นส่วนที่กำหนดแตกต่างกันหรือไม่เมื่อดูที่เกมของผู้เล่นที่แข็งแกร่งกว่าเมื่อเทียบกับเกมของผู้เล่นที่อ่อนแอกว่า? (ตัวอย่างเช่นบางทีผู้เล่นที่อ่อนแอกว่ามีแนวโน้มที่จะทำการจำนำได้มากขึ้นโดยเสียค่าใช้จ่ายในการย้ายชิ้นส่วนหรือพวกเขาทำการย้ายราชินีมากเกินไปฉันไม่รู้)

ผมสามารถที่จะให้คำตอบของคำถามก่อนหน้านี้โดยใช้ข้อมูลดิบที่ได้รับสารสกัดจากฐานข้อมูลขนาดใหญ่โดยคนอื่น ข้อมูลนั้นมาจากตัวอย่างของเกม 4M + ตั้งแต่การเล่นระดับปรมาจารย์จนถึงการเล่นแบบสมัครเล่นที่อ่อนแอและจำนวนรวมของการย้ายทั้งหมดที่ให้ไว้นั้นจะไม่แยกแยะตามความแข็งแกร่งของผู้เล่น ตอบคำถามของฉันจะต้องได้รับข้อมูลที่แยกต่างหากสำหรับเกมระหว่างผู้เล่นที่แข็งแกร่งและเกมระหว่างผู้เล่นอ่อนแอและฉันกำลังมองหาคำตอบการสำรองข้อมูลโดยข้อมูลมากกว่าเกร็ดเล็กเกร็ดน้อย

นี่คือคำถามของฉันที่เฉพาะเจาะจงมากขึ้น:

มีเกณฑ์การให้คะแนน Elo N เช่นว่าเมื่อดูจำนวนการเคลื่อนไหวเฉลี่ยในเกมแยกตามประเภทของชิ้นส่วนมีความแตกต่างอย่างมีนัยสำคัญระหว่างสิ่งที่พบในเกมที่มีผู้เล่นเหนือ N และสิ่งที่พบในเกม เนื้อเรื่องผู้เล่นด้านล่าง N.

มันจะน่าสนใจหากพบสิ่งเหล่านี้มากกว่านี้เช่นความแตกต่างที่เป็นรูปธรรมระหว่างผู้เล่นที่แข็งแกร่งและอ่อนแอกว่าที่สามารถตรวจจับได้โดยการขุดข้อมูล การค้นพบดังกล่าวอาจชี้ไปที่พฤติกรรมเฉพาะที่ทำให้ผู้เล่นถอยกลับหรือตรงกันข้ามกับสิ่งที่ขับเคลื่อนพวกเขาไปข้างหน้า ตอนนี้อาจจะไม่พบความแตกต่างดังกล่าวเพียงแค่ดูข้อมูลประเภทนี้ แต่ฉันก็สนใจที่จะรู้เช่นกัน


ฉันค่อนข้างสงสัยเกี่ยวกับข้อมูลรวมดังกล่าวเพราะอาจพลาดจุด บางเกมมีการตัดสินใจโดยการเล่นกับชิ้นอื่น ๆ โดยการผลักเบี้ย ความถี่ของชิ้นงานที่เคลื่อนไหวนั้นไม่ได้เกี่ยวกับคุณภาพของการเคลื่อนไหว มีกฎง่ายๆที่บอกว่าคุณไม่ควรขยับชิ้นส่วนใดบ่อยๆในช่องเปิด อย่างไรก็ตามผู้เล่นที่แข็งแกร่งใช้กลยุทธ์นี้บางครั้งถ้ามันเป็นธรรมโดยตำแหน่ง
Michael

@Michael ฉันเห็นด้วยอย่างยิ่งว่าปัจจัยเช่นสิ่งที่ฉันถามเกี่ยวกับตัวเองจะไม่ได้บ่งบอกถึงการเล่นที่ดี; ถ้าฉันย้ายประเภทชิ้นส่วนของฉันด้วยความถี่สัมพัทธ์เท่ากับ Aronian บอกว่าแน่นอนไม่ได้หมายความว่าฉันเล่นได้ดีเหมือนเขา แต่นั่นเป็นเหตุผลว่าทำไมมันอาจเป็นไปได้ว่า Elo 1800 ไม่มีความแตกต่างที่ตรวจพบได้ในความถี่สัมพัทธ์เหล่านี้ (แม้ว่าจะมีความสามารถมากมายกว่า 1800) ในขณะที่ต่ำกว่า 1,800 ก็จะเอียงอย่างมีนัยสำคัญ การค้นพบในข้อมูลนั้นสามารถระบุปัจจัยหนึ่งที่อยู่เบื้องหลังผู้เล่นที่ต่ำกว่าขีดจำกัดความแข็งแกร่งนั้น
ETD

1
โปรดทราบว่าข้อมูลจะแสดงให้คุณเห็นว่าผู้ดูแลทำอย่างไรเมื่อพวกเขากำลังเผชิญหน้ากับผู้ดูแลอื่นและเช่นเดียวกันกับผู้เล่นที่น้อยกว่า เป็นการดีที่คุณต้องการเปรียบเทียบสิ่งที่ดีกว่าและแย่กว่าผู้เล่นทำในตำแหน่งที่เหมือนกันแต่นั่นอาจจะไม่สามารถทำได้ผ่านการบันทึกข้อมูลยกเว้นในการเปิด
Evan Harper

@EdDean - หัวข้อนี้ค่อนข้างน่าสนใจ ความคิดใดที่เขาได้รับเกม 4M + อย่างแน่นอน? มีสถานที่ที่เราจะได้รับขนาดที่สำคัญ (เช่นเกม 100K +) จากแหล่งที่มีชื่อเสียง แต่ฟรีหรือไม่? ฉันกำลังคิดถึงแหล่งที่สามารถดาวน์โหลดได้ง่ายโดยเฉพาะเมื่อเทียบกับ "การค้นหาออนไลน์"
Daniel B

1
เพียงเพื่อติดตามวิกิพีเดียมีหน้าดีในคอลเลกชันเกมหมากรุก จากลิงค์เหล่านี้ดูเหมือนลิงค์แรกที่มีแนวโน้มมากที่สุด (จำนวน PGNs ที่ซิปเล็กน้อยเพื่อดาวน์โหลด) แต่ส่วนใหญ่ขาดหายไป (รหัส ECO B ถึง E) ซึ่งจะทำให้การวิเคราะห์ด้านเดียวและไร้ประโยชน์
Daniel B

คำตอบ:


29

นี่เป็นการวิเคราะห์ที่สกปรกอย่างรวดเร็วตามฐานข้อมูล PGN "Million Base" ฉันทำสิ่งนี้อย่างเร่งด่วนดังนั้นอาจมีข้อผิดพลาดในการเขียนโปรแกรมหรือตรรกะของฉัน โปรดอย่าใช้มันเพื่ออะไรที่ร้ายแรงเกินไป อัปเดต - หมายเหตุ:จริงๆแล้วฉันเพิ่งสังเกตว่าฉันทำผิดกับชุดข้อมูลและ จำกัด ไว้ที่ 1 ล้านระเบียนแรก ฉันจะโพสต์การอัปเดตเมื่อฉันมีเวลาว่างในการรันอีกครั้งในทุกสิ่ง ในขณะเดียวกันตัวเลขเหล่านี้น่าสนใจ

การรับข้อมูล:

ฉันได้รับไฟล์ Million Base 1.74 จากURL นี้เนื่องจากไซต์ top-5000.nl ดูเหมือนจะ 404 เมื่อคุณพยายามดาวน์โหลด ไฟล์ดังกล่าวมีมากกว่า 1 ล้านเกมในรูปแบบการส่งออก PGN (กล่าวคือง่ายต่อการแยกวิเคราะห์)

น่าเสียดายที่กว่า 60% ของเกมไม่มีข้อมูลการจัดเรต (ฉันกำลังมองหาแท็ก "WhiteELO" และ "BlackELO") และแม้แต่น้อยก็มีเรตติ้งสำหรับผู้เล่นทั้งสองคน ในตอนท้ายฉันตัดสินใจที่จะเพิ่มขนาดตัวอย่างให้ใหญ่ที่สุดเท่าที่จะทำได้และนับการเคลื่อนไหวของผู้เล่นหากการจัดอันดับของเขาหรือเธอเป็นที่รู้จักโดยไม่คำนึงถึงการจัดอันดับของผู้เล่นคนอื่น

กระบวนการ:

เกมดังกล่าวได้รับการแยกวิเคราะห์ทีละรายการและหากมีการจัดอันดับของผู้เล่นเป็นที่ทราบกันแล้วการเคลื่อนไหวทั้งหมดของพวกเขาสำหรับเกมนั้นจะถูกเพิ่มเข้าไปในการรวมสำหรับกลุ่มการจัดอันดับของผู้เล่น ฉันเลือกที่จะแบ่งการจัดอันดับออกเป็น 100 กลุ่มเช่น 1600 ถึง 1699 เป็นกลุ่มเดียว

เนื่องจาก movetext ที่แท้จริงใน PGN คือ SAN ฉันใช้ทางลัดต่อไปนี้เพื่อนับการเคลื่อนไหว: Knight (N), Bishop (B), Rook (R), Queen (Q) และ King (K) ย้ายทั้งหมดเริ่มต้นด้วยตัวอักษรชิ้น . Castling (OO และ OOO) ถูกนับแยกเป็นกรณีพิเศษ การเคลื่อนไหวที่เหลือทั้งหมดจะถูกนับเป็นการจำนำโดยไม่มีการตรวจสอบเพิ่มเติม

ไม่มีการล้างข้อมูล ไม่มีความพยายามในการระบุตัวผู้ผิดและลบออก (เช่นเกมที่สั้นและยาวเกินไป ฯลฯ ) ฉันเก็บไว้ แต่ไม่ได้รวมไว้ในการวิเคราะห์ต่อไปนี้ผลลัพธ์จากการจัดอันดับต่ำกว่า 1600 - ขนาดตัวอย่างสำหรับเกมเหล่านี้ต่ำกว่า 100 ซึ่งนำไปสู่ผลลัพธ์ที่หลากหลาย ข้อมูลดิบมีให้ในตอนท้ายของโพสต์นี้

ข้อบกพร่องบางประการของข้อมูล: ในขณะนี้ฉันได้รวบรวมผลรวมพื้นฐานเท่านั้นและให้ค่าเฉลี่ย ฉันค่อนข้างแน่ใจว่าโดยทั่วไปแล้วข้อมูลจะไม่ถูกกระจายออกไป แต่จะไม่สามารถพูดได้มากกว่านี้หากไม่แสดงผลจำนวนจริงและเรียกใช้ข้อมูลเหล่านั้นผ่านโปรแกรมทางสถิติ ฉันอาจทำเช่นนั้นหากมีความสนใจ ในขณะนี้หมายถึงไม่มีช่วงความมั่นใจหรือข้อมูลอื่น ๆ เกี่ยวกับการกระจายของตัวเลขที่ค่าเฉลี่ยเหล่านั้นเป็นตัวแทน ฉันยังไม่ได้ตรวจสอบว่าชุดข้อมูลมีช่วงเวลากี่ปี - ถ้ามันแสดงถึงหลายปีอาจเป็นประโยชน์ในการพยายามแก้ไขเพื่อความแข็งแรงโดยรวมของฟิลด์

เทรนด์บางส่วน:

คำพูดเกี่ยวกับการให้คะแนนของผู้เล่น - กลุ่มอันดับที่พบบ่อยที่สุดคือตามลำดับ: 2400 ถึง 2500, 2500 ถึง 2600 และ 2300 ถึง 2400 กลุ่มคะแนนเหล่านี้ให้ 72% ของเกมที่ถูกนับ

เมื่อดูผลลัพธ์ที่เกิดขึ้นจริงความยาวของเกมโดยเฉลี่ยนั้นค่อนข้างประหลาดใจ:

จำนวนการย้ายเฉลี่ยตามกลุ่มการจัดอันดับ

กลุ่มเรตติ้งย่อย 2,000 ทั้งหมดมีเกมที่สั้นกว่ากลุ่มที่สูงกว่าอย่างมาก สิ่งนี้อาจอธิบายได้โดยความเป็นไปได้ว่าพวกเขากำลังเล่นคู่ต่อสู้ที่แข็งแกร่งกว่า (ดูคะแนนเฉลี่ยด้านบน) และพวกเขาพ่ายแพ้ในการเคลื่อนไหวน้อยลง สิ่งนี้ดูเหมือนจะขัดแย้งกับเกมที่สั้นกว่าเล็กน้อยที่เล่นโดยกลุ่มอันดับสูงสุดแม้ว่าอาจมีขนาดตัวอย่างเล็กลง

ความแตกต่างที่ค่อนข้างใหญ่ของความยาวของเกมโดยเฉลี่ยหมายถึงการให้ความถี่ในการเคลื่อนย้ายชิ้นส่วนหนึ่งมากกว่าจำนวนครั้งที่ชิ้นส่วนถูกย้ายอาจเป็นการเปรียบเทียบที่ยุติธรรมกว่า การคำนวณผลลัพธ์ความถี่ในกราฟต่อไปนี้:

ย้ายความถี่ทีละชิ้น

แนวโน้มต่อไปนี้ดูเหมือนจะเป็นปัจจุบัน:

  • ความถี่ของการเคลื่อนไหวของอัศวินดูเหมือนว่าจะมีแนวโน้มลดลงเล็กน้อยด้วยคะแนน
  • อธิการเลื่อนเทรนด์ลงไปจนถึงปี 2000 จากนั้นค่อย ๆ เทรนด์ขึ้น
  • Rook เคลื่อนไหวแนวโน้มสูงขึ้นอย่างรวดเร็วในจุดเดียวกันและอยู่บ่อยกว่าการเคลื่อนไหวของ Bishop ในการเล่นระดับสูง
  • การเคลื่อนไหวจำนำดูเหมือนว่าจะมีแนวโน้มลดลงเล็กน้อยด้วยคะแนนที่เพิ่มขึ้น ข้อยกเว้นขนาดใหญ่คือประเภทสูงสุด 2800 ถึง 2900 สิ่งนี้นำเราไปสู่จุดต่อไป:
  • หมวดหมู่ที่ให้คะแนนสูงสุดให้ค่าผิดปกติหรือแนวโน้มกลับในการวัดจำนวนค่อนข้างมาก สิ่งนี้อาจอธิบายได้หลายวิธี - 1) ขนาดตัวอย่างค่อนข้างต่ำที่ 363 ไม่ใช่เล็ก แต่ 10% ของขนาดตัวอย่างที่เล็กที่สุดถัดไปรวมอยู่ด้วย 2) เนื่องจากพวกเขาอยู่ในอันดับต้น ๆ ของกลุ่มเรตติ้งพวกเขาไม่เคยเล่นคู่ต่อสู้ที่ "แข็งแกร่ง" กว่าตัวพวกเขาเอง 3) หรือเพียงแค่ในระดับนี้สไตล์การเล่นของพวกเขาได้ก้าวข้ามระดับต่ำกว่าพวกเขา ฉันเดาว่าจะเป็นการรวมกันของ 1) และ 2)
  • ความแตกต่างในการเคลื่อนไหวของราชินีและการเคลื่อนไหวแบบเหวี่ยงนั้นมีขนาดเล็กมากโดยไม่มีแนวโน้มที่แท้จริงนอกเหนือไปจากแนวโน้มเล็ก ๆ ทั้งสองกรณี
  • ความถี่ของการเคลื่อนไหวของกษัตริย์มีความแตกต่างที่ใหญ่ที่สุด มองไม่เห็นแนวโน้มที่ชัดเจนและดูเหมือนจะเปลี่ยนทิศทาง 3 หรือ 4 ครั้ง

การวิเคราะห์เพิ่มเติม

แนวคิดบางประการสำหรับการวิเคราะห์ในอนาคต:

  • การแก้ไขสถิติพื้นฐาน: ฉันรู้สึกว่าเกมที่สั้นและยาวมากอาจไม่ได้รับการยกเว้น นอกจากนี้การกระจายของจำนวนจริงอาจบอกได้มาก
  • การแยกวิเคราะห์ต่อไปอาจทำให้ได้ผลลัพธ์ที่น่าสนใจ ตัวอย่างเช่นฉันสนใจที่จะทราบว่าความถี่ของการจับคู่ขาวดำเป็นเท่าไร (เหมือนกันหรือแตกต่างกันอย่างไร?)
  • การจัดหมวดหมู่ตามความแตกต่างของคะแนนอาจน่าสนใจผู้เล่นที่เล่นคู่ต่อสู้ที่แข็งแกร่งกว่า (เช่น 200 คะแนนเหนือพวกเขา) เล่นด้วยความถี่การเคลื่อนที่ที่ต่างกันหรือไม่? น่าเสียดายที่สิ่งนี้ต้องการให้ ELO ของผู้เล่นทั้งสองเป็นที่รู้จักซึ่งหายากในชุดข้อมูลนี้
  • แนวโน้มของปราสาทสั้นและปราสาทยาวอาจแตกต่างกันไปตามอันดับ
  • สถิติการส่งเสริมการขายชิ้นการวิเคราะห์โครงสร้างบางอย่าง (เช่นอุบัติการณ์ของเบี้ยสองเท่า, en passant, หมุด, ส้อม, แสดงโดยอันดับ) อาจจะลึกซึ้ง
  • "แผนที่ความร้อน" ของการจัดวางชิ้นบนกระดานจริงซึ่งแสดงโดยการจัดอันดับอาจค่อนข้างรบกวน

รวบรวมข้อมูลในรูปแบบ CSV

สำหรับผู้ที่ต้องการเล่นกับข้อมูลรู้สึกฟรี

ช่วงเรตติ้ง, ขนาดตัวอย่าง, ความยาวเกมโดยเฉลี่ย, การจำนำเฉลี่ย, การเคลื่อนที่ของอัศวินโดยเฉลี่ย, การเคลื่อนไหวบิชอปโดยเฉลี่ย, การเคลื่อนไหวโกงโดยเฉลี่ย, การเคลื่อนที่ของราชินีโดยเฉลี่ย, การเคลื่อนที่ของพระราชาโดยเฉลี่ย, การเคลื่อนที่โดยเฉลี่ย

1100 to 1200,4,28.500,7.000,4.000,4.000,6.500,3.750,2.750,0.500
1300 to 1400,16,34.125,9.250,6.813,5.000,4.438,4.563,3.188,0.875
1400 to 1500,35,33.800,9.400,6.114,5.514,4.514,4.057,3.400,0.800
1500 to 1600,61,33.607,8.705,7.459,4.984,4.443,4.033,3.148,0.836
1600 to 1700,163,33.153,9.227,6.485,5.110,4.699,3.969,2.816,0.847
1700 to 1800,301,31.811,8.894,6.223,5.402,4.468,3.734,2.296,0.794
1800 to 1900,307,34.251,9.537,6.642,5.577,4.889,4.039,2.759,0.808
1900 to 2000,450,35.551,9.731,6.778,5.451,5.444,4.442,2.871,0.833
2000 to 2100,3958,38.731,10.302,7.095,6.072,6.242,4.668,3.481,0.871
2100 to 2200,11217,38.905,10.501,7.116,6.086,6.245,4.629,3.445,0.884
2200 to 2300,50848,39.446,10.595,7.167,6.174,6.420,4.717,3.484,0.889
2300 to 2400,79322,39.248,10.551,7.141,6.141,6.469,4.653,3.402,0.891
2400 to 2500,111867,38.394,10.398,7.013,6.086,6.294,4.542,3.168,0.893
2500 to 2600,92225,38.308,10.396,6.972,6.082,6.344,4.515,3.104,0.896
2600 to 2700,33193,39.340,10.565,7.061,6.295,6.579,4.630,3.318,0.891
2700 to 2800,4805,40.938,10.945,7.221,6.725,6.930,4.726,3.494,0.895
2800 to 2900,363,38.865,11.311,6.879,6.284,6.160,4.391,2.983,0.857

ดี! ขอบคุณที่ใช้ตัวเลขที่นี่ ถ้าคุณคิดว่าความคิดเห็นใด ๆ ในส่วน "การวิเคราะห์เพิ่มเติม" ของคุณนั้นสุกงอมให้ถามโปรดอย่าลังเลที่จะทำเช่นนั้น
ETD

1
@ Eddean ขอบคุณและฉันอาจจะทำการวิเคราะห์เพิ่มเติมเมื่อเวลาอนุญาต ฉันยังสังเกตเห็นการปรับปรุงเพิ่มเติมบางอย่างที่สามารถทำได้ (เช่นการกรองเกมสายฟ้าแลบและ simultan และอื่น ๆ ) ดังนั้นมันอาจจะเป็นงานที่ค่อนข้าง ฉันจะสร้างการอัปเดตเมื่อฉันมีบางอย่าง
Daniel B

1
ว้าว. นั่นเป็นคำตอบที่ค่อนข้าง น่าอัศจรรย์
James Tomasino

3
ฉันจะไม่แปลกใจถ้าพูดว่าการเพิ่มจำนวน rook ในหมู่ผู้เล่นที่แข็งแกร่งนั้นหมายความว่าพวกเขามีแนวโน้มที่จะจบลงด้วยการจบ rook นานมากกว่าที่พวกเขาจะย้าย rooks บ่อยขึ้นในตำแหน่งที่คล้ายกัน
dfan

3
@dfan ฉันเห็นด้วยตัวเลขเหล่านี้อาจเกี่ยวข้องกับเอฟเฟกต์ลำดับที่สองที่หลากหลายมากขึ้นเช่นผู้เล่นที่มีอันดับต่ำกว่าทำผิดพลาดตั้งแต่ต้นและไม่เข้าสู่การเป็นผู้เล่นที่ยาวนาน ฯลฯ ฉันมีความคิดที่หลากหลายเกี่ยวกับ น่าเสียดายที่ไม่มีเวลาที่จะใช้มัน
Daniel B
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.