ทำไมระบบการให้คะแนน Elo ใช้กฎการอัปเดตที่ไม่ถูกต้อง


10

ระบบการจัดระดับ Elo ใช้อัลกอริธึมการลดความลาดชันแบบลาดชันของฟังก์ชั่นการสูญเสียข้ามเอนโทรปีระหว่างความน่าจะเป็นที่คาดหวังและที่สังเกตได้ของผลลัพธ์ในการเปรียบเทียบแบบคู่ เราสามารถเขียนฟังก์ชั่นการสูญเสียทั่วไปเป็น

E=n,ipiLog(qi)

ที่ผลรวมจะดำเนินการมากกว่าผลลัพธ์และฝ่ายตรงข้ามทั้งหมดn คือความถี่ที่สังเกตได้ของเหตุการณ์และถึงความถี่ที่คาดหวังn P ฉันฉันถามฉันผมnพีผมผมQผม

ในกรณีที่มีเพียงสองผลลัพธ์ที่เป็นไปได้ (ชนะหรือหลวม) และหนึ่งฝ่ายตรงข้ามที่เรามี

E=-พีLโอก.(Q)-(1-พี)Lโอก.(1-Q)

ถ้าคืออันดับของผู้เล่นและคืออันดับของผู้เล่นเราสามารถสร้างความน่าจะเป็นที่คาดหวังในฐานะ จากนั้นกฎการอัพเดทลาดลงทางลาดชันฉันπ j j q ฉัน = e π ฉันπผมผมπJJ qj=e π j

Qผม=อีπผมอีπผม+อีπJ
QJ=อีπJอีπผม+อีπJ

πผม'=πผม-η(Qผม-พีผม)

πJ'=πJ-η(QJ-พีJ)

ที่และหน้าผมจะคาดหวังและความน่าจะเป็นที่สังเกตของการชนะของผู้เล่นที่ผมกับผู้เล่นที่ j นี่คือกฎการอัพเดทQผมพีผมผมJtwo outcomes

ในการปรากฏตัวของการจับเราสามารถสรุปโมเดลข้างต้นรวมถึงและผลลัพธ์ที่สามด้วยความน่าจะเป็น

qi(w)=eπi

Q(d)=νอีπผม+πJ2อีπผม+อีπJ+νอีπผม+πJ2
qj(w)=eπj
Qผม(W)=อีπผมอีπผม+อีπJ+νอีπผม+πJ2
QJ(W)=อีπJอีπผม+อีπJ+νอีπผม+πJ2

และเราสามารถสร้างฟังก์ชั่นการสูญเสียเป็น

E=-พี(W)Lโอก.(Q(W))-(1-พี(W)-พี(d))Lโอก.(Q(ล.))-พี(d)Lโอก.(Q(d))

พี(W),พี(ล.),พี(d)winloosedrawQ(W),Q(ล.),Q(d)winloosedraw

πผม'=πผม-η(Qผม(W)+Qผม(d)2-พีผม(W)-พีผม(d)2)

πJ'=πJ-η(QJ(W)+QJ(d)2-พีJ(W)-พีJ(d)2)

QJ(W)QJ(d)ผมJพีผม(W)พีผม(d)ผมJthree outcome

คำถามคือทำไมระบบการจัดเรตของ Elo จึงใช้two outcomesกฎการอัปเดตแม้จะมีการเสมอ

คำตอบ:


3

ความน่าจะเป็นของการวาดภาพซึ่งต่างจากการมีผลลัพธ์ที่เด็ดขาดไม่ได้ระบุไว้ในระบบ Elo การจับสลากจะพิจารณาทั้งในผลการแข่งขันที่คาดหวังและผลการแข่งขันครึ่งชนะและแพ้ครึ่ง

ตัวอย่างจากหน้า Elo ใน Wikipedia : "คะแนนที่คาดหวังของผู้เล่นคือความน่าจะเป็นที่จะชนะและครึ่งหนึ่งเป็นไปได้ของการวาดดังนั้นคะแนนที่คาดไว้ที่ 0.75 สามารถแสดงถึงโอกาส 75% ในการชนะโอกาส 25% แพ้และโอกาส 0% ของการวาดภาพในสุดโต่งอื่น ๆ มันอาจเป็นตัวแทนของโอกาส 50% ในการชนะโอกาสในการแพ้ 0% และโอกาสในการวาด 50% "

two outcomeRA'=RA+K(SA-EA)SA=1(nW+0.5nd)+0(0.5nd+nล.)SA=1SA=0.5SA=0

เช่นเดียวกับ Elo ระบบ Glicko ไม่ได้วาดรูปแบบ แต่ทำการอัปเดตตามค่าเฉลี่ยของการชนะและการสูญเสีย (ต่อผู้เล่น) แต่ในระบบการจัดอันดับTrueSkill "การจับสลากเป็นแบบจำลองโดยสมมติว่าความแตกต่างของประสิทธิภาพในเกมนั้น ๆ มีขนาดเล็กดังนั้นโอกาสในการวาดขึ้นอยู่กับความแตกต่างของความแข็งแกร่งในการเล่นของผู้เล่นสองคนอย่างไรก็ตามการค้นพบเชิงประจักษ์ในเกม การแสดงหมากรุกที่มีโอกาสดึงดูดระหว่างผู้เล่นมืออาชีพมากกว่าผู้เริ่มต้นดังนั้นโอกาสในการวาดก็ดูเหมือนจะขึ้นอยู่กับระดับความสามารถ "

วิธีนี้ต้องใช้เฉพาะที่แตกต่างกันการสร้างแบบจำลองสำหรับทุกเกม (และ TrueSkill ถูกนำไปใช้ไม่กี่เกมของ Microsoft Xbox) ดังนั้นจึงเหมาะในอีโลและ Glicko (ออกแบบมาเฉพาะสำหรับหมากรุก) และมันไม่ได้สำหรับrankade , ระบบการจัดอันดับของเราอเนกประสงค์


'คะแนนที่คาดหวังของผู้เล่นคือความน่าจะเป็นของเขาในการชนะ เป็นสิ่งที่ฉันพบในสูตรด้านบน อย่างไรก็ตามในสูตรอัปเดต Elolo ไม่ได้ระบุความน่าจะเป็นครึ่งหนึ่งของการเสมอในขณะที่คุณกำลังชี้ให้เห็น คำถามยังคงอยู่ทำไมในระบบการจัดอันดับ Elo เราไม่สนใจเกี่ยวกับการดึง?
emanuele

1
คุณสามารถแสดงคะแนนที่คาดหวังได้เสมอว่าเป็นโอกาสในการชนะและโอกาสในการแพ้ (และไม่มีโอกาสในการจั่ว - ดูตัวอย่างแรกจาก Wikipedia) ในกรณีนี้ 'คะแนนที่คาดหวังของผู้เล่นคือความน่าจะเป็นของเขาที่จะชนะ' (และอีกมากมายเนื่องจากความน่าจะเป็นครึ่งหนึ่งของการวาดภาพเป็นศูนย์) หลังจากการแข่งขันครั้งเดียวผลลัพธ์ที่ได้คือการชนะหรือแพ้หรือชนะครึ่ง แม้ว่าคุณจะมีเกมที่อนุญาตให้เสมอคุณสามารถอัปเดตคะแนน Elo โดยใช้การผสมผสานระหว่างการชนะและการแพ้ราวกับว่าเสมอไม่มีโอกาส
Tomaso Neri
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.