นี่เป็นปัญหาจริงที่โด่งดังในด้านการเรียนรู้ของเครื่อง ใน ~ 2006 Netflix เสนอ $ 1m ให้อัลกอริทึมที่ให้การปรับปรุงที่เหมาะสมที่สุดกับระบบผู้แนะนำของพวกเขา ทฤษฏีของการแก้ปัญหาที่ชนะจะถูกกล่าวถึงสั้น ๆ ในหนังสือเรียนของคาลเทคเรื่องการเรียนรู้เครื่องเบื้องต้น
โดยทั่วไปวิธีการเรียนรู้ชุดถูกนำมาใช้ โดยเฉพาะอย่างยิ่งชนิดของการผสมหรือการซ้อนถูกใช้ นี่ไม่ใช่เรื่องขี้ขลาด แต่เป็นสัญชาตญาณ เพื่อให้เข้าใจถึงสัญชาตญาณของการใช้วิธีการทางสถิติที่แตกต่างกันให้พิจารณาเหตุผลที่แตกต่างกันของคนที่ชอบหนังเรื่องเดียวกันนั่นคือโจอาจชอบ Topgun เพราะเขาชอบหนังแอ็คชั่นยุค 80 ในขณะที่เจนชอบ Topgun เพราะเธอชอบภาพยนตร์ ดังนั้นความจริงที่ว่าผู้ชมทั้งสองดู (และให้คะแนนภาพยนตร์สูง) ไม่จำเป็นต้องหมายความว่าพวกเขาจะชอบหนังอื่นที่มีความน่าจะเป็นสูง อัลกอริทึมการทำนายจะสามารถรองรับความแตกต่างเหล่านี้อย่างน้อยก็ในบางความสามารถ
สิ่งนี้อาจทำให้โซลูชันดูเรียบง่าย แต่การปรับสมดุลอัลกอริธึมการแข่งขันและการจัดลำดับความสำคัญการเดาที่ดีที่สุดสำหรับแต่ละกรณีนั้นไม่ง่าย ความจริงที่ว่า Netflix นั้นมอบเงินรางวัลจำนวนมากควรทำให้ขนาดของความท้าทายค่อนข้างชัดเจน
หากคุณเพิ่งเริ่มต้นเรียนรู้ด้วยเครื่องการตรวจสอบแหล่งข้อมูลข้างต้นอาจมีประโยชน์ขึ้นอยู่กับระดับความสนใจและภูมิหลังทางคณิตศาสตร์ของคุณ ดังนั้นการถดถอยอาจทำงานได้ดีถึงดี แต่มีประสิทธิภาพที่ดีขึ้นอย่างมาก