ด้านล่างเป็นรุ่นที่เรียบง่ายมาก พวกเขาทั้งสองขาดอย่างน้อยหนึ่งวิธี แต่บางทีพวกเขาอาจจะให้บางสิ่งบางอย่างเพื่อเสริมสร้างต่อไป อันที่จริงรุ่นที่สองไม่ได้พูดถึงสถานการณ์ของ OP (ดูหมายเหตุด้านล่าง) แต่ฉันจะทิ้งไว้ในกรณีที่มันช่วยได้บ้าง
รุ่นที่ 1 : ตัวแปรของโมเดล Bradley – Terry
สมมติว่าเราให้ความสนใจเป็นหลักในการทำนายว่าทีมใดทีมหนึ่งจะชนะอีกทีมโดยอิงจากผู้เล่นในแต่ละทีม เราก็สามารถบันทึกว่า 1 ทีมที่มีผู้เล่นเต้น 2 ทีมที่มีผู้เล่น( k , ℓ )สำหรับแต่ละเกมไม่สนใจคะแนนสุดท้าย แน่นอนว่านี่เป็นการทิ้งข้อมูลบางส่วน แต่ในหลายกรณียังคงให้ข้อมูลจำนวนมาก(i,j)(k,ℓ)
รุ่นที่เป็นแล้ว
logit(P(Team 1 beats Team 2))=αi+αj−αk−αℓ.
นั่นคือเรามีพารามิเตอร์ "ความสัมพันธ์" สำหรับผู้เล่นแต่ละคนที่มีผลต่อจำนวนผู้เล่นที่เพิ่มโอกาสในการชนะทีมของเขา กําหนดของผู้เล่น "แข็งแรง" โดยฉัน จากนั้นโมเดลนี้ยืนยันว่า
P ( ทีม 1 ชนะทีม 2 ) = s i s jsi=eαi
P(Team 1 beats Team 2)=sisjsisj+sksℓ.
มีความสมมาตรที่ดีมากในที่นี้ซึ่งไม่สำคัญว่าการตอบสนองจะถูกเข้ารหัสอย่างไรตราบใดที่มันสอดคล้องกับตัวทำนาย นั่นก็คือเรายังมี
logit(P(Team 2 beats Team 1))=αk+αℓ−αi−αj.
นี้สามารถใส่ได้ง่ายเป็นถดถอยโลจิสติกที่มีการพยากรณ์ว่าเป็นตัวชี้วัด (หนึ่งสำหรับผู้เล่นแต่ละคน) การคุ้มค่าถ้าเล่นผมอยู่ในทีม 1 สำหรับเกมในคำถาม- 1ถ้าเธออยู่ในทีมที่ 2 และ0ถ้าเธอไม่ได้ เข้าร่วมในเกมนั้น+1i−10
จากนี้เรายังมีอันดับที่เป็นธรรมชาติสำหรับผู้เล่น ยิ่ง (หรือs ) ยิ่งใหญ่ผู้เล่นก็ยิ่งเพิ่มโอกาสในการชนะของทีม ดังนั้นเราสามารถจัดอันดับผู้เล่นตามค่าสัมประสิทธิ์โดยประมาณของพวกเขา (โปรดทราบว่าพารามิเตอร์ affinity นั้นสามารถระบุได้ถึงออฟเซ็ตทั่วไปเท่านั้นดังนั้นจึงเป็นเรื่องปกติที่จะแก้ไขα 1 = 0เพื่อให้สามารถระบุโมเดลได้)αsα1=0
รุ่นที่ 2 : การให้คะแนนอิสระ
หมายเหตุ : เมื่ออ่านคำถามของ OP อีกครั้งเห็นได้ชัดว่ารุ่นด้านล่างไม่เพียงพอสำหรับการตั้งค่าของเขา ฝ่าย OP สนใจในเกมที่จบลงหลังจากมีคะแนนคงที่จำนวนหนึ่งโดยทีมใดทีมหนึ่งหรืออีกฝ่ายหนึ่ง โมเดลด้านล่างมีความเหมาะสมมากกว่าสำหรับเกมที่มีช่วงเวลาคงที่ การปรับเปลี่ยนสามารถทำได้เพื่อให้เหมาะสมกับกรอบการทำงานของ OP แต่จะต้องมีคำตอบแยกต่างหากสำหรับการพัฒนา
ตอนนี้เราต้องการติดตามคะแนน สมมติว่ามันเป็นการประมาณที่สมเหตุสมผลว่าแต่ละทีมทำคะแนนเป็นอิสระจากกันด้วยจำนวนคะแนนที่ทำในช่วงเวลาใด ๆ โดยไม่ขึ้นอยู่กับช่วงเวลาที่แยกจากกัน จากนั้นจำนวนคะแนนแต่ละคะแนนของทีมสามารถจำลองเป็นตัวแปรแบบปัวซองได้
ij
log(μ)=γi+γj
โปรดทราบว่ารุ่นนี้จะไม่สนใจการจับคู่ที่แท้จริงระหว่างทีมโดยมุ่งเน้นที่การให้คะแนนอย่างแท้จริง
σi=eγi(i,j)(k,ℓ)
P(Team 1 beats Team 2 in sudden death)=σiσjσiσj+σkσℓ.
ρiδi(i,j)(k,ℓ)
log(μ1)=ρi+ρj−δk−δℓ
log(μ2)=ρk+ρℓ−δi−δj
การให้คะแนนยังคงเป็นอิสระในรุ่นนี้ แต่ตอนนี้มีปฏิสัมพันธ์ระหว่างผู้เล่นในแต่ละทีมที่ส่งผลต่อคะแนน ผู้เล่นสามารถจัดอันดับตามการประมาณค่าสัมประสิทธิ์ของความสัมพันธ์
แบบจำลองที่ 2 (และตัวแปร) อนุญาตการทำนายคะแนนสุดท้ายเช่นกัน
ส่วนขยาย : วิธีหนึ่งที่มีประโยชน์ในการขยายทั้งสองรุ่นคือการรวมการสั่งซื้อโดยที่ตัวบ่งชี้เชิงบวกตรงกับทีม "บ้าน" และตัวบ่งชี้เชิงลบไปยังทีม "ไม่อยู่" การเพิ่มคำศัพท์ดักจับในแบบจำลองนั้นสามารถตีความได้ว่าเป็น "ข้อได้เปรียบของโฮมฟิลด์" ส่วนขยายอื่น ๆ อาจรวมถึงการรวมความเป็นไปได้ของความสัมพันธ์ในรุ่น 1 (จริง ๆ แล้วมันเป็นไปได้ในรุ่น 2)
หมายเหตุ : อย่างน้อยหนึ่งในการสำรวจความคิดเห็นทางคอมพิวเตอร์ ( Peter Wolfe's ) อย่างน้อยหนึ่งรายการที่ใช้สำหรับการแข่งขัน Bowl Championshipในอเมริกันคอลเลจฟุตบอลใช้แบบจำลองมาตรฐานของแบรดลีย์ - เทอร์รี่เพื่อจัดอันดับ