คุณต้องมีโมเดลความน่าจะเป็น
แนวคิดที่อยู่เบื้องหลังระบบการจัดอันดับคือตัวเลขเพียงตัวเดียวแสดงให้เห็นถึงความสามารถของผู้เล่น เราอาจเรียกหมายเลขนี้ว่า "ความแข็งแกร่ง" (เพราะ "อันดับ" หมายถึงบางสิ่งที่เฉพาะเจาะจงในสถิติ) เราคาดการณ์ว่าผู้เล่น A จะชนะผู้เล่น B เมื่อความแรง (A) เกินความแข็งแกร่ง (B) แต่คำแถลงนี้อ่อนแอเกินไปเพราะ (a) มันไม่ใช่เชิงปริมาณและ (b) ไม่ได้คำนึงถึงความเป็นไปได้ของผู้เล่นที่อ่อนแอกว่าในบางครั้ง เราสามารถเอาชนะปัญหาทั้งสองได้โดยสมมติว่าความน่าจะเป็นที่ A ชนะ B ขึ้นอยู่กับความแตกต่างในจุดแข็งของพวกเขาเท่านั้น หากเป็นเช่นนั้นเราสามารถแสดงจุดแข็งทั้งหมดที่จำเป็นเพื่อให้ความแตกต่างในจุดแข็งเท่ากับอัตราต่อรองของการชนะ
โดยเฉพาะรุ่นนี้คือ
L o กรัมฉันที (Pr( เต้น B))= λA- λB
โดยที่นิยามคืออัตราต่อรองและฉันได้เขียนเพื่อความแข็งแกร่งของผู้เล่น A เป็นต้นλ Al o g i t (p)=บันทึก( p ) - บันทึก( 1 - p )λA
โมเดลนี้มีพารามิเตอร์มากที่สุดเท่าที่ผู้เล่น (แต่มีอิสระน้อยกว่าหนึ่งระดับเพราะมันสามารถระบุจุดแข็งสัมพัทธ์เท่านั้นดังนั้นเราจะแก้ไขพารามิเตอร์หนึ่งในค่าที่กำหนดเอง) มันเป็นโมเดลเชิงเส้นทั่วไปชนิดหนึ่ง(ในตระกูล Binomial พร้อมลิงค์ logit)
พารามิเตอร์สามารถประมาณโดยสูงสุดโอกาส ทฤษฎีเดียวกันให้วิธีการสร้างช่วงความเชื่อมั่นรอบการประมาณพารามิเตอร์และทดสอบสมมติฐาน (เช่นผู้เล่นที่แข็งแกร่งที่สุดตามการประมาณการนั้นแข็งแกร่งกว่าผู้เล่นที่อ่อนแอที่สุดโดยประมาณ)
โอกาสของชุดเกมคือผลิตภัณฑ์
Πเกมส์ทั้งหมดประสบการณ์( λผู้ชนะ- λคนขี้แพ้)1 + ประสบการณ์( λผู้ชนะ- λคนขี้แพ้).
หลังจากแก้ไขค่าของหนึ่งในการประมาณการของคนอื่นคือค่าที่เพิ่มความเป็นไปได้สูงสุดนี้ ดังนั้นการประมาณค่าที่แตกต่างกันจะช่วยลดโอกาสในการเกิดสูงสุด หากลดลงมากเกินไปก็ไม่สอดคล้องกับข้อมูล ในแบบนี้เราสามารถหาช่วงความมั่นใจสำหรับพารามิเตอร์ทั้งหมด: พวกเขาเป็นข้อ จำกัด ที่การประเมินที่แตกต่างกันไม่ได้ลดโอกาสในการบันทึกมากเกินไป สมมติฐานทั่วไปสามารถทดสอบได้ในทำนองเดียวกัน: ข้อ จำกัด ของจุดแข็ง (เช่นโดยสมมติว่าพวกเขาเท่ากันทั้งหมด) ข้อ จำกัด นี้ จำกัด โอกาสที่จะได้รับขนาดใหญ่และหากข้อ จำกัด สูงสุดนี้อยู่ไกลเกินกว่าค่าสูงสุดจริงสมมติฐานคือ ปฏิเสธλ
ในปัญหาเฉพาะนี้มี 18 เกมและ 7 พารามิเตอร์ฟรี โดยทั่วไปนั้นเป็นพารามิเตอร์มากเกินไป: มีความยืดหยุ่นมากที่พารามิเตอร์สามารถเปลี่ยนแปลงได้อย่างอิสระมากโดยไม่เปลี่ยนโอกาสสูงสุดมาก ดังนั้นการใช้เครื่องจักร ML จึงมีแนวโน้มที่จะพิสูจน์ได้อย่างชัดเจนว่ามีข้อมูลไม่เพียงพอที่จะเชื่อมั่นในการประเมินความแข็งแรง