เหตุใดการไม่ปฏิเสธจึงสำคัญสำหรับระบบการกรอง / ผู้แนะนำที่ทำงานร่วมกัน?


11

ในระบบแนะนำที่ทันสมัยทั้งหมดที่ฉันได้เห็นว่าต้องอาศัยการแยกตัวประกอบแบบเมทริกซ์การแยกตัวประกอบแบบเมทริกซ์ที่ไม่เป็นลบจะดำเนินการกับเมทริกซ์ภาพยนตร์ผู้ใช้ ฉันสามารถเข้าใจได้ว่าทำไมการไม่ปฏิเสธมีความสำคัญต่อการตีความและ / หรือถ้าคุณต้องการปัจจัยที่กระจัดกระจาย แต่ถ้าคุณสนใจเฉพาะการคาดการณ์เท่านั้นเช่นในการแข่งขันชิงรางวัล netflix ทำไมต้องกำหนดข้อ จำกัด ที่ไม่ปฏิเสธ ดูเหมือนว่าจะเลวร้ายยิ่งกว่าการอนุญาตให้มีค่าลบในการแยกตัวประกอบของคุณ

กระดาษนี้เป็นหนึ่งในตัวอย่างที่อ้างถึงอย่างสูงของการใช้ตัวประกอบเมทริกซ์ที่ไม่เป็นลบในการกรองร่วมกัน


1
ฉันไม่คุ้นเคยกับระบบผู้แนะนำ (บางทีคุณอาจมีตัวอย่างเอกสารในคำถามของคุณ?) หากรูปแบบของการตั้งค่าแบบ NNMF ที่คุณอนุมานนั้นเป็นจริงคำตอบที่เป็นไปได้มากที่สุดคือการปรับปรุงความสามารถในการใช้งานทั่วไป ในคำอื่น ๆ มันอาจจะเป็นที่สังเกตุการขาดของ "interpretability / เบาบาง" มีความเกี่ยวข้องกับมากกว่ากระชับ อย่างไรก็ตามการเขียนรหัสกระจัดกระจาย (เช่น L1 normalization / LASSO) สามารถตอบสนองความต้องการเหล่านี้เท่าที่ฉันรู้ (อาจเป็น NNMF ซึ่งมีความสามารถในการตีความสูงกว่า)
GeoMatt 22

คำตอบ:


14

ฉันไม่ใช่ผู้เชี่ยวชาญในระบบแนะนำ แต่เท่าที่ฉันเข้าใจหลักฐานของคำถามนี้ผิด

การไม่ปฏิเสธไม่สำคัญสำหรับการกรองแบบร่วมมือกัน

รางวัล Netflixได้รับรางวัลในปี 2009 โดยทีมงาน BellKor นี่คือกระดาษอธิบายขั้นตอนวิธีการของพวกเขาBellKor 2008 วิธีการแก้ Netflix รางวัล เป็นเรื่องง่ายที่จะเห็นพวกเขาใช้วิธีการที่ใช้ SVD:

รากฐานของความคืบหน้าของเราในช่วงปี 2008 นั้นได้ถูกจัดวางในเอกสาร KDD 2008 [4] [... ] ในกระดาษ [4] เราให้คำอธิบายโดยละเอียดของโมเดลสามปัจจัย อันแรกคือ SVD แบบง่าย [... ] แบบที่สอง [... ] เราจะอ้างถึงโมเดลนี้ว่า“ Asymmetric-SVD” ในที่สุดรูปแบบตัวคูณที่แม่นยำยิ่งขึ้นจะได้ชื่อว่า "SVD ++" [... ]

ดูเพิ่มเติมนี้เป็นที่นิยมมากขึ้นเขียนขึ้นโดยทีมงานเดียวกันเทคนิคเมทริกซ์ตีนเป็ดสำหรับระบบ recommender พวกเขาพูดถึง SVD มาก แต่ไม่พูดถึง NNMF เลย

ดูโพสต์บล็อกยอดนิยมนี้ได้รับการอัปเดต Netflix: ลองใช้ที่บ้านจากปี 2549 รวมทั้งอธิบายแนวคิด SVD

แน่นอนว่าคุณพูดถูกและมีงานบางอย่างในการใช้ NNMF สำหรับการกรองร่วมกันเช่นกัน ดังนั้นสิ่งที่ดีกว่า SVD หรือ NNMF ฉันไม่มีความคิด แต่นี่คือบทสรุปของการศึกษาเปรียบเทียบอัลกอริทึมการกรองความร่วมมือจากปี 2012:

วิธีการที่ใช้เมทริกซ์ - การแยกตัวประกอบโดยทั่วไปมีความแม่นยำสูงสุด โดยเฉพาะ SVD, PMF และการแปรผันตามปกติจะทำงานได้ดีที่สุดเท่าที่แม่และ RMSE ยกเว้นในสถานการณ์ที่เบาบางมากซึ่ง NMF ทำงานได้ดีที่สุด


2
โดยทั่วไปนี่เป็นคำตอบที่ดี แต่เพื่อแก้ไขข้อเท็จจริงบางอย่างโซลูชัน BellKor 2008 ได้รับรางวัลความคืบหน้า อัลกอริทึมที่ชนะโดยรวมคือการผสมผสานของตัวทำนายมากกว่า 100 รายการ (Töscher et al. 2009) NMF ก็เป็นส่วนหนึ่งของมันเช่นกัน
dpelisek
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.