กลไกการแนะนำอะไรสำหรับสถานการณ์ที่ผู้ใช้สามารถเห็นเศษส่วนของรายการทั้งหมดเท่านั้น


9

ฉันต้องการที่จะเพิ่มคุณลักษณะข้อเสนอแนะไปยังระบบการจัดการเอกสาร เป็นเซิร์ฟเวอร์ที่จัดเก็บเอกสารของ บริษัท ส่วนใหญ่ พนักงานเรียกดูเว็บอินเตอร์เฟสและคลิกเพื่อดาวน์โหลด (หรืออ่านออนไลน์) เอกสารที่ต้องการ
พนักงานแต่ละคนมีสิทธิ์เข้าถึงชุดย่อยของเอกสารทั้งหมดเท่านั้น:

พนักงานสามารถเข้าถึงเอกสารบางส่วนได้เท่านั้น

เป้าหมายของฉัน : แนะนำเพื่อนร่วมทีมให้เอกสารที่เพิ่งเปิดโดยเพื่อนร่วมทีมของพวกเขาหรือสเปรดชีตที่ทำหน้าที่เป็นภาคผนวกของเอกสารที่เพิ่งเปิดหรือสิ่งที่พวกเขาอาจต้องการอ่าน

มีกลไกการแนะนำจำนวนมากสำหรับข้อมูลที่เปิดเผยต่อสาธารณะ (ผู้ใช้ Netflix ทุกคนสามารถดูภาพยนตร์ทั้งหมด) แต่สถานการณ์ที่นี่เป็นพิเศษ: พนักงานแต่ละคนได้รับอนุญาตให้ใช้เศษส่วนของเอกสารทั้งหมดเท่านั้นในขณะที่ผู้ใช้ Netflix ทุกคนสามารถเข้าถึงภาพยนตร์ทั้งหมดได้

ตัวอย่าง : Employee1 สามารถอ่าน DocumentA แต่ไม่ใช่ DocumentB Employee2 สามารถอ่านได้ทั้งสองและ Employee3 ไม่สามารถอ่านใด ๆ

แน่นอนฉันต้องไม่แนะนำเอกสารของพนักงานที่เขา / เธอไม่สามารถเข้าถึงได้ นอกจากนี้ฉันคิดว่าฉันควรพิจารณาความนิยมของเอกสารเฉพาะในบริบทของพนักงานที่สามารถเข้าถึงเอกสารได้ เพื่อทำให้สิ่งที่ซับซ้อนยิ่งขึ้นบางครั้งพนักงานย้ายจากโครงการหนึ่งไปอีกโครงการหนึ่งซึ่งส่งผลกระทบต่อเอกสารที่พวกเขาสามารถเข้าถึงได้

  • มีชื่อของปัญหาประเภทนี้หรือไม่?
  • สามารถลดลงโดยไม่สูญเสียความแม่นยำ / ประสิทธิภาพไปสู่ปัญหาที่พบบ่อยได้หรือไม่
  • ถ้าไม่แนวทางใดจะทำงานได้ดีสำหรับปัญหาประเภทนี้

หมายเหตุ: เอ็นจิ้นการแนะนำที่เหมือน Netflix นั้นไม่ดีพอ ควรมีเอกสารที่มีจำนวนการดู 50 ครั้งหากพนักงาน 10 คน (รวมถึงฉัน) สามารถเข้าถึงเอกสารได้ แต่จะไม่โดดเด่นหากพนักงาน 100,000 คนเข้าถึงได้

ในกรณีที่จำเป็นต้องใช้นี่คือข้อมูลเฉพาะบางส่วน: บริษัท โดยเฉลี่ยมีพนักงาน 1,000 คนเอกสารประมาณ 10,000 ฉบับพนักงานคลิกประมาณ 5 เอกสารต่อวัน แต่ละโครงการมีพนักงานโดยเฉลี่ย 10 คนที่สามารถเข้าถึงและมีเอกสารประมาณ 100 รายการ พนักงานแต่ละคนทำงานโดยเฉลี่ย 5 โครงการในแบบคู่ขนาน

คำตอบ:


1

ฉันรู้สึกว่าคุณต้องพูดถึงสองสิ่งแยกกัน

ก่อนอื่นคุณต้องมีการควบคุมการเข้าถึงสำหรับผู้ใช้ในระบบของคุณ คุณสามารถมีโทเค็นการเข้าถึงที่แนบมากับผู้ใช้แต่ละคนและไฟล์ กรองฐานข้อมูลไฟล์ก่อนที่คุณจะดำเนินการ

ประการที่สองการจัดอันดับเอกสารที่ฉันอยากจะแนะนำให้มีน้ำหนักสำหรับน้ำหนักเอกสารและน้ำหนักผู้ใช้ที่สัมพันธ์กับผู้ใช้การเรียกดูในปัจจุบัน

ตัวอย่างเช่นฉันสามารถคิดถึงน้ำหนักเอกสารและน้ำหนักผู้ใช้ดังต่อไปนี้ แต่อาจซับซ้อนกว่านี้ตามระบบของคุณ -

DocumentWeight = Number of Views/ Number of Users can Access
UserWeight = ## Relative to browsing user- Users in similar project will have higher weights

DocumentScore = Sum over all viewed users{DocumentWeight x UserWeight}

คุณสามารถจัดอันดับเอกสารซึ่งจะเป็นการดึงเอกสารที่คุณต้องการ ฉันหวังว่านี่จะช่วยได้บ้าง


0

จากคำอธิบายของคุณผมขอแนะนำให้คุณมองไปที่วิธีการที่เรียกว่าการกรองการทำงานร่วมกัน โดยทั่วไปคุณสามารถปฏิบัติต่อมุมมอง / การดาวน์โหลดเอกสารใด ๆ เป็นข้อเสนอแนะในเชิงบวกสำหรับบางรายการและจากนั้นแนะนำรายการดังกล่าวสำหรับผู้ใช้ที่ดูเอกสารที่คล้ายกัน

การกรองผลลัพธ์ที่ซ่อนควรทำตามผู้ใช้แต่ละคน (คุณพบคำแนะนำที่เป็นไปได้ทั้งหมด แต่ให้ส่งออกเฉพาะผู้ใช้ที่มีสิทธิ์ดูเท่านั้น)


ฉันไม่คิดว่าวิธีการทั่วไปเช่นนั้นจะพอเพียง: เอกสารที่มีจำนวนการดู 50 ครั้งควรจะโดดเด่นหากพนักงาน 10 คน (รวมถึงฉัน) สามารถเข้าถึงได้ แต่ไม่โดดเด่นหากพนักงาน 100,000 คนเข้าถึงได้
Nicolas Raoul

ฉันอธิบายไม่ใช่วิธีการ แต่เป็นแนวคิดทั่วไป การกรองร่วมกันมีความซับซ้อนมากขึ้นและลิงก์ที่ฉันให้ไว้เป็นจุดเริ่มต้นที่ดีในขณะที่คุณสามารถค้นหาการนำไปใช้และแนวทางที่แตกต่างกันและหาสิ่งที่เหมาะสมที่สุดสำหรับข้อมูลเฉพาะของคุณ
chewpakabra

ฉันอธิบายข้อมูลเฉพาะของฉันอย่างชัดเจนเพียงพอในคำถามของฉันหรือไม่ หากไม่มีโปรดอย่าลังเลที่จะสอบถามข้อมูลใด ๆ ที่จำเป็นก่อนที่จะสามารถแนะนำวิธีการเฉพาะได้ ขอบคุณมาก :-)
นิโคลัสราอูล

สิ่งที่ฉันสับสนคือการไม่มีความคิดที่ชัดเจนว่าทำไมเอกสารที่มี 10,000 มุมมองไม่คุ้มค่าที่จะแสดงตามคำแนะนำและอีกหนึ่งมุมมองที่มี 50 วิวก็โอเค ประมาณ 100 ล่ะ หรือ 51 หากคุณมีเปอร์เซ็นต์ของผู้ชมที่แน่นอนซึ่งทำให้จำนวนการดูไม่เกี่ยวข้องคุณสามารถแยกกรณีดังกล่าวออกจากชุดฝึกอบรมและยังคงยึดแนวทางการทำงานร่วมกัน ถ้าไม่มีคุณอาจมีปัญหาการจำแนกหรือการจัดกลุ่มบางประเภทซึ่งเป็นหัวข้อที่กว้างขึ้น
chewpakabra

ตัวเลข 10000 มาจากไหน หากคุณหมายถึง 100,000 แล้วฉันก็ไม่ชัดเจนพอ: "มีสิทธิ์เข้าถึง" ไม่ได้หมายความว่า "ได้ดูแล้ว" หมายความว่า "ได้รับอนุญาตให้เข้าถึงหากพวกเขาต้องการ" กล่าวอีกนัยหนึ่งเอกสารแรกมีการดูโดยเฉลี่ย 10 ครั้งโดยบุคคลที่ได้รับอนุญาตให้ดู แต่เอกสารฉบับที่สองมีการดูเฉพาะค่าเฉลี่ย 0.0005 ครั้งโดยบุคคลที่ได้รับอนุญาตให้ดูแต่ละเอกสาร
Nicolas Raoul

0

พิจารณาการขุดชุดข้อมูลขนาดใหญ่หน้า 328 ซึ่งในที่สุดจะนำคุณไปสู่แผนกบริการที่ใช้กันทั่วไปในระบบผู้แนะนำ


หน้าเว็บที่คุณพูดถึงนำเสนอข้อมูลทั่วไปต่าง ๆ เกี่ยวกับการลดขนาด คุณจะสรุปสิ่งที่นำไปใช้กับคำถามข้างต้นได้หรือไม่ ขอบคุณมาก!
Nicolas Raoul

ใช่; มันแสดงให้เห็นถึงวิธีการใช้ SVD สำหรับคำแนะนำ
Drey
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.