การแปลงรายการการจัดอันดับบางส่วนเป็นการจัดอันดับโลก


13

ฉันกำลังทำงานบางอย่างเช่นปัญหาต่อไปนี้ ฉันมีกลุ่มผู้ใช้และหนังสือ N เล่ม ผู้ใช้แต่ละคนสร้างการจัดอันดับตามลำดับของหนังสือทั้งหมดที่เขาอ่าน (ซึ่งน่าจะเป็นชุดย่อยของหนังสือ N) เช่นเล่ม 1> เล่ม 40> เล่ม 25

ตอนนี้ฉันต้องการเปลี่ยนการจัดอันดับผู้ใช้เหล่านี้ให้เป็นอันดับหนึ่งของหนังสือทั้งหมด

มีวิธีการที่ดีหรือมาตรฐานที่จะลอง? จนถึงตอนนี้ฉันกำลังนึกถึงโมเดลแบรดลีย์ - เทอร์รี่ที่ใช้ในการเปรียบเทียบแบบคู่ แต่ฉันสงสัยว่ามีอะไรอีกไหม


2
ฉันคิดว่าคุณจะพบปัญหามากมายเกี่ยวกับ sparsity ยกเว้นว่าผู้ใช้ (ด้วยเหตุผลบางอย่าง) อ่านหนังสือที่คล้ายกัน แต่เมื่อให้คน n และจากที่คนส่วนใหญ่อ่านหนังสือไม่กี่คู่ส่วนใหญ่จะมีเพียงคนเดียวที่ทำให้การเปรียบเทียบ (หมายเลขมัธยฐานคือ 6 ต่อคนต่อปีดูPew
Peter Flom - Reinstate Monica

2
(+1) raegtin คุณถามคำถามที่ดีและน่าสนใจ ฉันชอบรุ่น BT แต่ดูเหมือนว่ามันฝืนถูกบังคับที่นี่ คุณคุ้นเคยกับวรรณคดีการกรองการทำงานร่วมกันหรือไม่? มันไม่ใช่ปัญหาเดียวกัน แต่สามารถยืมแนวคิดและเทคนิคบางอย่างได้ คำถามที่ไม่ได้รับการแก้ไขที่นี่คือเหตุผลว่าทำไมเราจึงควรเชื่อว่าหนังสือจะได้รับการจัดอันดับที่ชัดเจนและชัดเจนในตอนแรก (วิธีที่คุณจะจัดการกับกรณีที่สองใช้สองหนังสือเช่น?)
พระคาร์ดินัล

@ Peter Flom: ถูกต้องคู่ส่วนใหญ่ไม่มีการเปรียบเทียบ แต่ฉันหวังว่าไม่เป็นไรเพราะถ้าคุณรู้ว่า A> B และ B> C ดังนั้นแม้ว่า A และ C จะไม่ถูกเปรียบเทียบโดยตรงคุณสามารถอนุมาน A> C.
raegtin

@ cardinal: ใช่รุ่น BT ดูเหมือนจะถูกบังคับที่นี่ แต่มันเป็นสิ่งเดียวที่ฉันสามารถคิดได้ในขณะนี้ ฉันคุ้นเคยกับวรรณคดีการกรองที่ทำงานร่วมกัน แต่ฉันไม่แน่ใจว่าจะนำไปใช้ได้อย่างไรที่นี่เนื่องจากฉันต้องการการจัดอันดับไม่ใช่ความคล้ายคลึงกัน มันเป็นความจริงที่การจัดอันดับโลกเดียวนั้นไม่จำเป็นต้องสมเหตุสมผล (เช่นทำให้รู้สึกถึงการเปรียบเทียบหนังสือเด็กกับหนังสือผู้ใหญ่? นวนิยายกับนิยายไม่ใช่?) แต่ในทางปฏิบัติมันยังมีประโยชน์ รายการ "หนังสือที่ดีที่สุด" จะปรากฏขึ้นตลอดเวลา :)
raegtin

นอกจากนี้ฉันไม่สนใจมากเกี่ยวกับการเรียงลำดับอย่างใกล้ชิด (เช่นว่าหนังสืออันดับ # 1 ดีกว่าหนังสือ # 2 จริง ๆ หรือไม่) แต่เป็นการเรียงลำดับโดยรวม (เช่นฉันต้องการให้หนังสือ 10 อันดับแรกในการสั่งซื้อของฉันเป็น ดีกว่าต่ำกว่า 10% หรือกลาง 10%)
raegtin

คำตอบ:


2

หากคุณสนใจในการใช้งาน (มากกว่าในการพัฒนา) คุณควรให้ลองไปrankade , ระบบการจัดอันดับของเรา

Rankade นั้นฟรีและใช้งานง่ายและแตกต่างจากแบรดลีย์เทอร์รี่และระบบการจัดอันดับ Elo (นี่เป็นการเปรียบเทียบ ) เพราะสามารถจัดการแข่งขันที่มี 2+ กลุ่ม (เช่นหนังสือในสถานการณ์ของคุณ) การแทรกการจัดอันดับที่ผู้ใช้สั่งซื้อ ( ตรงกับหนังสือสองเล่มขึ้นไปที่มีอันดับสุดท้ายอย่างละเอียดรวมถึงความสัมพันธ์) คุณจะได้รับการจัดอันดับเรียงลำดับเดียวของหนังสือทั้งหมดที่คุณกำลังมองหา ในการติดยาเสพติดอันดับให้โอกาสคุณในการตรวจสอบวิวัฒนาการเวลาสำหรับการจัดอันดับหนังสือและสถิติสำหรับหนังสือที่ตรงกันและอื่น ๆ


1
คุณควรอธิบายอัลกอริทึมของคุณอย่างน้อยโดยทั่วไปเป็นวิธีการ และลิงก์ไปยังกระดาษที่มีคำอธิบายเต็ม มิฉะนั้นคำตอบของคุณอาจถือได้ว่าเป็นเพียงโฆษณา
ttnphns

1
ฉันได้เพิ่มลิงค์สำหรับการเปรียบเทียบอย่างง่ายระหว่างรีและระบบการจัดอันดับที่เป็นที่รู้จักมากที่สุด ข้อความแรกกล่าวว่าหากคุณสนใจใช้งาน (มากกว่าการพัฒนา)ดังนั้นมันจึงถูกเสนอเป็นวิธีแก้ปัญหา (ยศคุณลักษณะ GUI ในขณะที่ Bradley-Terry และ Plackett-Luce จำเป็นต้องมีการใช้งาน) มากกว่า พา ธ เพื่อไปยังโซลูชันที่ร้องขอ
Tomaso Neri

1

โมเดลการจัดอันดับของ Plackett-Luce จะจัดการกับปัญหานี้และเป็นเทคนิคพื้นฐานที่น่าจะเป็นซึ่งโอกาสสูงสุดนั้นจะถูกใช้โดยการทำ Majorization-maximization ซึ่งคล้ายกับ Expectation Maximization ในแง่ที่ว่าพวกเขาใช้ฟังก์ชันวัตถุประสงค์ช่วย ปรับให้เหมาะสมเพื่อรับประกันการเพิ่มฟังก์ชั่นความน่าจะเป็นซ้ำแบบซ้ำ ๆ (ดูขั้นตอนวิธี MM สำหรับโมเดลการจัดอันดับ Plackett-Luce โดย David Hunter) เขาให้รหัสเช่นกัน

จากมุมมองการจัดอันดับพวกเขาเป็นส่วนเสริมของโมเดล Bradley-Terry ที่คุณพูดถึงในโพสต์ของคุณ โมเดลของแบรดลีย์ - เทอร์รี่ประเมินการจัดอันดับโลกจากตัวอย่างการจัดอันดับแบบคู่ แบบจำลอง Plackett-Luce ขยายไปสู่การจัดอันดับความยาว 2 นอกจากนี้ยังอนุญาตให้แต่ละตัวอย่างมีการจัดอันดับความยาวแตกต่างกัน>=

เหมาะกับชุดข้อมูลของคุณอย่างสมบูรณ์แบบ:

เล่ม 1> เล่ม 40> เล่ม 25

เล่ม 40> เล่ม 30

เล่ม 25> เล่ม 17> เล่ม 11> เล่ม 3 ฯลฯ

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.