ระบบการให้คะแนน Glicko-2: ข้อผิดพลาดหรือการใช้ประโยชน์จาก?


13

ฉันเคยโพสต์สิ่งนี้บนStackOverflowเนื่องจากอาจเป็นข้อผิดพลาดในการนำไปใช้ แต่บางคนแนะนำว่าฉันโพสต์ในวิชาคณิตศาสตร์ ฉันเพิ่งพบ stackexchange นี้และฉันคิดว่าใครดีกว่ากัน พวกคุณบางคนอาจจะรู้ว่าไม้ตีค่อนข้างจะดูแม่นยำหรือไม่โดยไม่จำเป็นต้องทำการดีบั๊ก ยินดีต้อนรับลิงก์ใด ๆ สู่เครื่องคิดเลขออนไลน์หรือวิธีการให้คะแนนทางเลือก


Glicko-2 เป็นระบบการให้คะแนนที่ใช้ในหมากรุก แต่สามารถใช้ในสถานการณ์อื่น ๆ ได้ Glicko-2 เป็นการปรับปรุง Glicko-1 ซึ่งแก้ไขปัญหาการจัดอันดับ ELO ที่เก่ากว่า

สิ่งที่ทำให้ Glicko-2 เป็นพิเศษเมื่อเปรียบเทียบกับรุ่น 1 คือมันมีส่วนเบี่ยงเบนเรตติ้งที่สูงกว่า (RD) ที่สูงกว่าเมื่อมีคนไม่ทำงาน มันทำสิ่งนี้ด้วยความคิดของค่าคงที่ของระบบซึ่งเกี่ยวข้องกับเวลา / ช่วงเวลาการจัดอันดับ

ตัวอย่างการเขียนขึ้นจากผู้เขียนพบว่าที่นี่: http://www.glicko.net/glicko/glicko2.pdf
ภายในเอกสารนี้เขาอธิบาย:

ระบบ Glicko-2 ทำงานได้ดีที่สุดเมื่อจำนวนเกมในช่วงการจัดอันดับอยู่ในระดับปานกลางถึงใหญ่โดยเฉลี่ยอย่างน้อย 10-15 เกมต่อผู้เล่นหนึ่งคนในระยะเวลาการจัดอันดับ ระยะเวลาสำหรับช่วงเวลาการจัดอันดับขึ้นอยู่กับดุลยพินิจของผู้ดูแลระบบ

ทำให้สันนิษฐานว่ากลุ่มผู้เล่นหมากรุกที่ใช้งานอยู่เล่นเกมโดยเฉลี่ย 10-15 เกมในระยะเวลา 1 เดือนผู้ดูแลระบบจะอัปเดตการให้คะแนนทุกสิ้นเดือน


ฉันต้องการใช้ระบบจัดอันดับ Glicko-2 ของ PHP และพบสิ่งต่อไปนี้:

การติดตั้ง JavaScript ของ Glicko-2

  • JavaScript มีข้อผิดพลาดเล็กน้อยซึ่งไม่ปล่อยให้ตรงกับตัวอย่างการเขียนเชิงเทคนิคผู้เขียนพบว่าใกล้พอและไม่ต้องดีบัก

การใช้งาน PHP ของ Glicko-2

  • การใช้งาน PHP นั้นเต็มไปด้วยข้อบกพร่องมากมาย แต่นั่นก็ไม่ชัดเจนเว้นแต่คุณจะทำมากกว่าหนึ่งช่วงเวลา (ซึ่งเทคนิคการเขียนบทความไม่เคยแสดงค่าที่คาดหวังไว้)

เครื่องคิดเลข Glicko-2 ใน Excel

  • ในที่สุดเครื่องคิดเลข Excel ก็ดูเหมือนจะปราศจากข้อผิดพลาดและเป็นมืออาชีพมากที่สุดโดยใครบางคนในชุมชนหมากรุก เมื่อแก้ไขข้อผิดพลาด JavaScript แล้ว JavaScript และ Excel Calculator จะจับคู่กันอย่างใกล้ชิด (แม้ว่าจะไม่สมบูรณ์อาจเป็นข้อผิดพลาดในการปัดเศษ)

ฉันแก้ไขข้อผิดพลาด (และส่งปัญหา / โปรแกรมแก้ไขไปยังผู้เขียน) ฉันสามารถค้นหารุ่น PHP และ JavaScript เพื่อให้ตรงกับเครื่องคำนวณ Excel


ตอนนี้ฉันมั่นใจ 99% ว่าฉันมีการใช้งาน Glicko-2 ที่แม่นยำ (ระหว่าง 3 ตัวนี้) สำหรับการวิเคราะห์และนั่นคือตอนที่ฉันเจอสิ่งที่แปลกและหัวข้อของการสนทนานี้

รับค่าเริ่มต้นที่แนะนำสำหรับ Glicko-2 สำหรับผู้เล่นใหม่:

Rating:      1500
RD:           350
Volatility:  0.06

หากคุณพบคู่ต่อสู้โดยเฉลี่ยที่ 1378 และ RD 99 ( ที่มา ) เพียงครั้งเดียวทุกระยะเวลาการจัดอันดับ (1 เดือน) สำหรับ 12 ช่วงเวลาถัดไป (1 ปี) คุณจะได้รับการจัดอันดับระดับชาติ A (1800-1999) ที่ 1852 เมื่อในความเป็นจริงคุณจะเอาชนะผู้เล่นที่ได้คะแนนเฉลี่ย 12 คนตลอดระยะเวลา 12 เดือน

Month   Rating      RD      Volatility      Class
1       1625        259     0.059999        National Class B
2       1682        225     0.059998        〃
3       1718        205     0.059997        〃
6       1784        174     0.059994        〃
12      1852        148     0.059988        National Class A
24      1922        127     0.059976        〃

หากคุณเจอคู่ต่อสู้เฉลี่ย 2 คนในทุกช่วงเวลาคุณจะได้เข้าเรียนระดับชาติ A ประมาณ 4-5 เดือนโดยเผชิญหน้ากับคู่แข่งเพียง 8-10 คน

Month   Rating      RD      Volatility      Class
1       1672        215     0.059999        National Class B
2       1733        183     0.059997        〃
3       1770        166     0.059995        〃
4       1797        154     0.059993        〃
5       1819        146     0.059992        National Class A
6       1836        140     0.059991        〃


สมมติฐานเหล่านี้ถูกต้องหรือไม่ มีข้อบกพร่องในเครื่องคิดเลขของฉันหรือไม่?

หากไม่ใช่ข้อผิดพลาดอะไรคือวิธีในการโต้ตอบนี้นอกเหนือจาก:

  • พิจารณา "การให้คะแนนที่แท้จริง" เพื่อลดขอบเขตของความเบี่ยงเบน (Rating - RD)
  • อย่าแสดงคะแนนของผู้ใช้ที่ไม่ได้ใช้งาน
  • อย่าแสดงผู้ใช้ที่มีน้อยกว่า N เกม


คำตอบ:


9

ฉันทำงานเกี่ยวกับการติดตั้งระบบ Scala เมื่อไม่กี่เดือนที่ผ่านมาถึงแม้ว่ามันจะไม่ได้ขัดเงา แต่อย่างใดฉันควรจะกลับไปทำให้เสร็จ อย่างน้อยฉันก็ได้ผลลัพธ์ที่สมเหตุสมผลจากมัน

หากคุณชนะทุกเกมที่คุณเล่นใช่อันดับของคุณจะเพิ่มขึ้นค่อนข้างสูงแม้ว่าคุณจะเล่นกับผู้เล่นที่มีคะแนนต่ำเท่านั้น ความน่าจะเป็นที่คุณจะชนะทุกเกมกับคู่ต่อสู้ดังกล่าวน่าจะเกี่ยวกับสิ่งที่ผู้เล่นระดับ A จะทำได้

วิธีที่ดีที่สุดในการโต้ตอบในความคิดของฉันคือการไม่พิจารณาคนที่มี RD มากกว่าจำนวนหนึ่งเพื่อให้ได้คะแนนที่มั่นคง - นั่นคือถือว่าเป็น "ชั่วคราว" นอกจากนี้เพื่อให้ได้มาซึ่งชื่ออย่างน้อยใน USCF พวกเขามีระบบบรรทัดฐานที่คุณต้องเล่นในระดับหนึ่งในทัวร์นาเมนท์ 4 เกมขึ้นไป (4 ครั้งฉันเชื่อว่า) ซึ่งทำให้มีโอกาส จากการเล่นกับ ~ 1378 ตลอดทั้งทัวร์นาเมนท์ [สี่ครั้ง] ไม่น่าจะเป็นไปได้

เป็นเป้าหมายของคุณที่จะใช้สิ่งนี้สำหรับหมากรุก? กรณีการใช้งานของคุณคืออะไร?

อัปเดต: FICS จัดการโดยพิจารณาจากผู้ที่มี RD น้อยกว่า 80 เท่านั้น (พวกเขาใช้ Glicko-1 แต่ฉันเชื่ออย่างนั้น) http://www.freechess.org/Help/ficsfaq.html#Q005.003

และโดยวิธีการที่ Glicko-1 ใช้ RD / time decay เช่นกัน การปรับปรุงที่สำคัญของ Glicko-2 คือปัจจัย "ความผันผวน" ซึ่งช่วยให้คนที่มีผลลัพธ์ที่ไม่แน่นอนหรือผลการคำนวณมีความเสถียรแตกต่างกันเล็กน้อย ฉันคิดว่ามันเป็นการปรับแต่งเล็กน้อยสำหรับ Glicko-1 ซึ่งทำให้เกิดการคำนวณพิเศษมากมาย - แต่เหมือนคุณฉันยังคงสนใจที่จะคำนวณมัน ฉันขอ Glickman ตัวเองเพื่อหาดาต้าพอยท์เพิ่มเติมสำหรับการทดสอบ แต่เขายุ่งเกินกว่าที่จะจัดหามันในเวลานั้น


FYI ตำแหน่งระดับ USCF ต้องได้รับมาตรฐานใน 5 ทัวร์นาเมนต์
DM
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.