ทำไม FIDE ยังคงใช้ Elo


11

ฉันประทับใจกับวิธีการจัดอันดับของGlicko โดยเฉพาะอย่างยิ่ง:

  • มีเกมที่เล่นมากขึ้นเมื่อเร็ว ๆ นี้ทำให้การจัดอันดับของคุณมีเสถียรภาพ
  • เกมที่เล่นน้อยลงเมื่อเร็ว ๆ นี้ทำให้การจัดอันดับของคุณมีความผันผวนจนกว่าคุณจะได้รับเกมล่าสุดหลายเกมภายใต้เข็มขัดของคุณ

USCF แก้ไขระบบของพวกเขาให้คล้ายกันไม่กี่ปีหลัง (ที่มีสเกลเลื่อนเพื่อขยายหรือรองรับการเปลี่ยนแปลงการจัดอันดับสำหรับการแข่งขันที่กำหนด) และตอนนี้ที่ Glickman (นักประดิษฐ์ของ Glicko) อยู่ในคณะกรรมการจัดอันดับสำหรับ USCF ฉันคิดว่าในที่สุดพวกเขาก็จะนำระบบที่มีความยืดหยุ่นมาใช้เช่นเดียวกับเขาในที่สุด

มีเหตุผล (นอกเหนือจากการต่อต้านการเปลี่ยนแปลงหรือว่าพวกเขายังไม่ได้รับมัน) ที่สุจริตไม่ได้นำระบบการให้คะแนนที่แม่นยำยิ่งขึ้น?

คำตอบ:


9

ไม่ได้พิสูจน์ว่า Glicko นั้นมีความแม่นยำมากกว่า Glicko แก้ปัญหาด้วยวิธีที่ต่างกันโดยเน้นที่แตกต่างกัน พิจารณาว่าระบบเหล่านี้เป็นนามธรรมทำให้จิตใจของมนุษย์เป็นตัวเลข 4 หลัก

มีการจัดอันดับทางการเมืองมากมาย มันเป็นเรื่องที่งี่เง่า หากสุจริตจะนำมาใช้พวกเขาจะสร้างรายการใหม่ 100 อันดับแรกและ GM จำนวนมากน่าจะไม่พอใจ

ระบบ ELO นั้นเข้าใจง่ายมาก ความโปร่งใสเป็นสิ่งสำคัญ ระบบที่ซับซ้อนมากขึ้นมีข้อเสียทันที


6
+1 แม้ว่าฉันจะไม่เห็นด้วยกับย่อหน้าแรกส่วนที่เหลือของมันก็เป็นจริงพอ 1) Glicko ได้รับการพิสูจน์แล้วว่ามีความแม่นยำมากขึ้นโดยเฉลี่ย (วัดในแง่ของความถี่ที่สามารถทำนายได้ว่าใครจะชนะการแข่งขันที่กำหนด) 2) เกี่ยวกับการทำให้จิตใจมนุษย์เป็นนามธรรมนั้นไม่ได้เป็นเช่นนั้น มันเป็นตัวชี้วัดของทักษะที่คุณสามารถคำนวณความน่าจะเป็น (สำหรับ win / draw / loss) เมื่อเปรียบเทียบระดับทักษะ มันได้รับการสนับสนุนโดยคณิตศาสตร์และสถิติ ใน Glicko-2 ยังมีปัจจัยใหม่สำหรับความผันผวนสำหรับผู้เล่นที่เล่นไม่ลงรอยกัน (ทำให้เรตติ้งของพวกเขาผันผวนมากขึ้น)
อีฟฟรีแมน

1
น่าสนใจ อย่างไรก็ตามฉันขอยืนยันว่า 'ดีกว่าโดยเฉลี่ย' ไม่จำเป็นต้อง 'ดีกว่า' เกิดอะไรขึ้นถ้าเวลาที่มันไม่ถูกต้องทำให้เกิดอันตรายจริง อย่างไรก็ตามฉันจะอ่านมันให้ได้
Tony Ennis



7

เท่าที่ฉันเข้าใจระบบการจัดอันดับ Glicko เพิ่มคะแนนความน่าเชื่อถือให้กับหมายเลขการจัดอันดับซึ่งอาจให้ความเป็นธรรมที่สูงขึ้นเกี่ยวกับการคำนวณการปรับคะแนนคะแนน เห็นได้ชัดว่าสิ่งนี้อาจนำไปสู่การสันนิษฐานที่ผิดว่ามีความสัมพันธ์กันระหว่างการเล่นเกมที่ได้รับการจัดอันดับและความแข็งแรงในการเล่น (เนื่องจากไม่ได้เล่นจะลดคะแนนความน่าเชื่อถือซึ่งจะทำให้ ฉันเห็นปัญหามากมายที่เชื่อมโยงกับคะแนนความน่าเชื่อถือแม้ว่าฉันจะต้องยอมรับว่าฉันไม่เชี่ยวชาญเกี่ยวกับรายละเอียดปลีกย่อยของระบบ เพียงเลือกสาม:

  • ผู้เล่นที่เล่นเฉพาะเกมที่ไม่ค่อยจัดอันดับอาจไม่ได้รับคำเชิญอีกต่อไป ลองนึกภาพคุณเป็นผู้อำนวยการแข่งขันเชิญผู้เล่นที่น่าดึงดูด ตอนนี้คุณต้องเลือกระหว่างผู้เล่น 10 คนซึ่งทั้งหมดนี้มีหมายเลขเรตติ้งเท่ากัน แต่มีความน่าเชื่อถือต่างกัน อาจเป็นไปได้ว่าคุณจะเลือกหมายเลขที่น่าเชื่อถือที่สุดก่อน เมื่อเวลาผ่านไปช่องว่างความน่าเชื่อถือระหว่างผู้เล่นกับเกมที่ได้รับการจัดอันดับจำนวนมากและเกมที่น้อยกว่าอาจขยายออกไป
  • การจัดอันดับตัวเลขอาจง่ายขึ้น แม้แต่ระบบ ELO ก็ยังไม่โกงเพราะบางคนได้รับการจัดอันดับหรือบรรทัดฐาน IM / GM โดยการเล่นในทัวร์นาเมนต์ที่มีการแข่งขัน คะแนนความน่าเชื่อถือที่ดีอาจช่วยให้ผู้เล่นที่ไม่มีคะแนนความน่าเชื่อถือถูกมาก - ผู้เล่นที่ดีให้คะแนนโดยไม่สูญเสียตัวเองมากนัก ทันทีที่เงินเข้ามาเกี่ยวข้องการโกงความปลอดภัยก็เป็นประเด็นสำคัญ ฉันรู้สึกว่าระบบการจัดอันดับของ Glicko มีแนวโน้มที่จะบิดเบือน
  • การสื่อสารและความเข้าใจในการเล่นพละกำลังอาจเป็นเรื่องยากสำหรับคนทั่วไป เมื่อคุณสื่อสารรายการการจัดอันดับคุณพบปัญหา ผู้เล่นที่มีคะแนน 2,000-50 มี "กำลังเล่นที่แท้จริง" อยู่ระหว่าง 1900 ถึง 2100 ผู้เล่นอีกคนได้รับ 1950-2,000 ซึ่งแปลเป็นตัวเลขในช่วง 1750 และ 2150 ดังนั้นผู้เล่นที่มี 1950-2000 อาจเป็นผู้เล่นที่ดีกว่า แต่อาจจะอยู่ในอันดับที่ต่ำกว่าผู้เล่นคนอื่นเพียงเพราะเขาเล่นเกมน้อยลงหรือต่อต้านคู่แข่งขันที่เชื่อถือได้น้อยกว่า คุณอธิบายระบบการจัดอันดับของคุณให้ผู้คนฟังได้ยากขึ้นโดยไม่รับประกันความยุติธรรมมากขึ้น จีเอ็มที่หยุดเล่นอาจได้รับ "ความแข็งแกร่งที่มีศักยภาพ" และอวดอ้างศักยภาพของแชมป์เปี้ยนโลกของเขาเพราะหมายเลขความน่าเชื่อถือของเขาทำให้เพิ่มพื้นที่สำหรับการเบี่ยงเบน

ในการสรุป: คุณอาจได้รับมากกว่าที่คุณต่อรองเพราะแพ็คเกจทั้งหมดไม่เพียง แต่มาพร้อมกับการปรับปรุงเท่านั้น และเนื่องจากมีปัญหาทางการเงินจำนวนมากที่เกี่ยวข้องเมื่อคุณดูที่ส่วนบนของรายการการจัดอันดับฉันไม่เห็นข้อดีของการเปลี่ยนระบบที่มีอยู่


รายการการจัดอันดับส่วนใหญ่มีการตัดคะแนนความน่าเชื่อถือ (RD) แทนที่จะพยายามใช้เพื่อจัดอันดับผู้เล่น ดังนั้น 2000 (50) จะถูกจัดอันดับสูงกว่า 1950 (100) เสมอ ตามคะแนนปัจจุบันของพวกเขาพวกเขากำลังจัดอันดับสูงขึ้นโดยไม่คำนึงถึงความน่าเชื่อถือ หากผู้เล่นปี 1950 (100) จะชนะเมื่อเทียบกับปี 2000 (50) การจัดอันดับของพวกเขาจะเพิ่มขึ้นอย่างมีนัยสำคัญมากกว่าหากเป็นปี 1950 (50) คุณช่วยอธิบายได้ว่าคน ๆ หนึ่งอาจโกงระบบด้วย Glicko ในรายละเอียดเพิ่มเติมได้หรือไม่? คุณกำลังพูดถึง sandbagging การให้คะแนนของคุณถ้าคุณมี RD สูง?
อีฟฟรีแมน

@ West Freeman: ฉันสงสัยว่านี่เป็นสถานที่ที่สมบูรณ์แบบในการพิสูจน์ความสัมพันธ์แบบโกงของระบบการให้คะแนนและฉันแค่เดาเพราะฉันคิดว่ามันถูกกว่าที่จะจัดการกับระบบ ตัวเองเมื่อฉันสูญเสียความตั้งใจกับผู้เล่นที่ไม่มีการจัดอันดับ จุดสำคัญของคำตอบของฉันคือคุณควรตรวจสอบระบบไม่เพียง แต่สำหรับการคำนวณความเป็นธรรม แต่สำหรับการโกงความชัดเจนความสามารถในการติดต่อสื่อสาร ฯลฯ ก่อนที่คุณจะละทิ้งระบบการทำงาน
เรย์

แต่การเพิ่มอันดับของคนอื่นจะช่วยพวกเขาได้อย่างไร โดยปกติแล้วคนที่พยายามเล่นเกมระบบกำลังพยายามลดอันดับของพวกเขาลงเพื่อให้พวกเขาสามารถเล่นในส่วนที่ต่ำกว่าและชนะรางวัลที่หนึ่ง นี่อาจเป็นเรื่องง่ายขึ้นสำหรับ Glicko ถ้าคุณหลีกเลี่ยงการเล่นเป็นเวลานานแล้วแพ้สองสามเกมที่คุณควรจะได้รับ แต่เมื่อรวมกับชั้นการให้คะแนนและความจริงที่ว่าสิ่งนี้สามารถทำได้ทุกครั้งในขณะที่เนื่องจาก RD ใช้เวลาในการย้อนกลับ
Eve Freeman

1
คุณอาจต้องให้คะแนนสูงเพื่อให้ได้มาซึ่งชื่อรับคำเชิญหรือรับเงินจากสโมสรเพื่อเล่นให้พวกเขาหรือทำงานเป็นผู้ฝึกสอน ฉันกำลังพูดเกี่ยวกับหมากรุกมืออาชีพที่นี่และที่เงินจริงเพราะคุณถามพฤติกรรมของสุจริต
Ray
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.