คำถามติดแท็ก recommender-system

เครื่องมือแนะนำจะพยายามคาดการณ์ว่าผู้ใช้จะเพลิดเพลินกับสินค้าบางอย่าง (ภาพยนตร์หนังสือเพลง ฯลฯ ) และให้คำแนะนำมากเพียงใด ผู้ขายออนไลน์มักใช้เพื่อแนะนำการซื้อใหม่

5
ฉันจะใช้ SVD ในการกรองร่วมกันได้อย่างไร
ฉันสับสนเล็กน้อยเกี่ยวกับวิธีการใช้ SVD ในการกรองร่วมกัน สมมติว่าฉันมีกราฟโซเชียลและสร้างเมทริกซ์คำคุณศัพท์จากขอบจากนั้นใช้ SVD (ลองลืมเกี่ยวกับการทำให้เป็นปกติอัตราการเรียนรู้การเพิ่มประสิทธิภาพการกระจัดกระจาย ฯลฯ ) ฉันจะใช้ SVD นี้เพื่อปรับปรุงคำแนะนำของฉันได้อย่างไร สมมติว่ากราฟโซเชียลของฉันตรงกับ instagram และฉันได้รับมอบหมายหน้าที่ในการแนะนำผู้ใช้ในบริการโดยใช้กราฟโซเชียลเท่านั้น ฉันจะสร้างเมทริกซ์ adjacency AA\mathbf A (m×m)(m×m)(m\times m) , รับ SVD, A=UsVA=UsV\mathbf A = \mathbf{U s V} , เลือกeigenvalues แรกkkk, แล้วอะไร? ฉันน่าจะสร้างเมทริกซ์ชุดใหม่: แล้วจะทำอะไรได้บ้าง?UnewsnewVnew∼m×k∼k×k∼k×mUnew∼m×ksnew∼k×kVnew∼k×m\begin{align} \mathbf U_{new} &\sim m\times k \\ \mathbf s_{new} &\sim k\times k \\ \mathbf V_{new} &\sim …

3
R: การสุ่มฟอเรสต์การโยน NaN / Inf ในข้อผิดพลาด“ การเรียกฟังก์ชันต่างประเทศ” แม้จะไม่มีชุดข้อมูลของ NaN [ปิด]
ฉันใช้คาเร็ตเพื่อรันฟอเรสต์แบบสุ่มที่ผ่านการตรวจสอบความถูกต้องข้ามชุดข้อมูล ตัวแปร Y เป็นปัจจัย ไม่มีชุดข้อมูลของ NaN, Inf's หรือ NA ในชุดข้อมูลของฉัน อย่างไรก็ตามเมื่อใช้ป่าสุ่มฉันได้รับ Error in randomForest.default(m, y, ...) : NA/NaN/Inf in foreign function call (arg 1) In addition: There were 28 warnings (use warnings() to see them) Warning messages: 1: In data.matrix(x) : NAs introduced by coercion 2: In data.matrix(x) : NAs …

3
จะเกิดอะไรขึ้นเมื่อคุณใช้ SVD กับปัญหาการกรองร่วมกัน ความแตกต่างระหว่างสองคืออะไร?
ในการกรองร่วมกันเรามีค่าที่ไม่ได้กรอกหากผู้ใช้ไม่ได้ดูภาพยนตร์แล้วเราต้องใส่ 'na' ลงไปที่นั่น ถ้าฉันจะใช้ SVD ของเมทริกซ์นี้จากนั้นฉันต้องใส่ตัวเลขลงไปที่นั่น - บอก 0 ตอนนี้ถ้าฉันแยกเมทริกซ์เมทริกซ์ฉันมีวิธีหาผู้ใช้ที่คล้ายกัน พื้นที่มิติลดลง) แต่การตั้งค่าที่คาดการณ์เอง - สำหรับผู้ใช้รายการจะเป็นศูนย์ (เพราะนั่นคือสิ่งที่เราป้อนในคอลัมน์ที่ไม่รู้จัก) ดังนั้นฉันจึงติดอยู่กับปัญหาของการกรองการทำงานร่วมกันกับ SVD พวกเขาดูเหมือนจะเกือบจะเหมือนกัน แต่ไม่มาก อะไรคือความแตกต่างระหว่างสิ่งเหล่านี้กับสิ่งที่เกิดขึ้นเมื่อฉันใช้ SVD กับปัญหาการกรองแบบทำงานร่วมกัน ฉันทำแล้วและผลลัพธ์ดูเหมือนจะยอมรับได้ในแง่ของการค้นหาผู้ใช้ใกล้เคียงซึ่งยอดเยี่ยม แต่อย่างไร

4
ความหมายของคุณสมบัติแฝง?
ฉันกำลังพยายามที่จะเข้าใจรูปแบบเมทริกซ์การแยกตัวประกอบสำหรับระบบผู้แนะนำและฉันมักจะอ่าน 'คุณสมบัติที่แฝงอยู่' แต่นั่นหมายความว่าอย่างไร ฉันรู้ว่าคุณลักษณะใดมีความหมายต่อชุดข้อมูลการฝึกอบรม แต่ฉันไม่สามารถเข้าใจแนวคิดเกี่ยวกับคุณลักษณะแฝง บทความในหัวข้อที่ฉันพบทุกฉบับนั้นตื้นเกินไป แก้ไข: ถ้าอย่างน้อยคุณก็สามารถชี้ให้ฉันดูเอกสารที่อธิบายความคิดนั้นได้

3
ระบบผู้แนะนำแบบไดนามิก
Recommender ระบบจะวัดความสัมพันธ์ระหว่างการจัดอันดับของผู้ใช้งานที่แตกต่างกันและข้อเสนอแนะที่อัตราผลตอบแทนสำหรับผู้ใช้ที่ได้รับเกี่ยวกับรายการที่อาจเป็นที่สนใจของเขา อย่างไรก็ตามรสนิยมเปลี่ยนไปตามกาลเวลาดังนั้นการให้คะแนนแบบเก่าอาจไม่สะท้อนการตั้งค่าปัจจุบันและในทางกลับกัน คุณอาจใส่ "ยอดเยี่ยม" ลงในหนังสือคุณจะให้คะแนนว่า "ไม่น่าขยะแขยงเกินไป" และอื่น ๆ นอกจากนี้ผลประโยชน์ของตัวเองก็เปลี่ยนแปลงเช่นกัน ระบบผู้แนะนำควรทำงานในสภาพแวดล้อมที่เปลี่ยนแปลงอย่างไร ทางเลือกหนึ่งคือการตัดคะแนน "เก่า" ซึ่งอาจใช้งานได้ดีสมมติว่าคุณกำหนด "เก่า" ไว้อย่างถูกต้อง (คุณสามารถพูดได้ว่าคะแนนไม่หมดอายุและแสร้งทำเป็นว่าไม่มีปัญหา) แต่มันไม่ใช่ตัวเลือกที่ดีที่สุด: แน่นอนว่ารสชาติมีวิวัฒนาการเป็นกระแสชีวิตปกติและไม่มีเหตุผลว่าทำไมเราไม่สามารถใช้ความรู้พิเศษในการจัดอันดับที่ถูกต้องในครั้งเดียว ตัวเลือกอื่นคือเพื่อรองรับความรู้พิเศษนี้ ดังนั้นเราจึงไม่เพียงแค่ค้นหา "การจับคู่แบบทันที" สำหรับความสนใจปัจจุบันของคุณ แต่แนะนำสิ่งที่คุณอาจชอบต่อไป (ตรงข้ามกับสิ่งที่คุณอาจชอบตอนนี้ ) ฉันไม่แน่ใจว่าฉันจะอธิบายเรื่องนี้ดีพอ โดยทั่วไปฉันชอบแนวทางที่สองและกำลังพูดถึงระบบผู้แนะนำซึ่งจะวัดความสัมพันธ์ของวิถีการรับรสและคำแนะนำเกี่ยวกับผลผลิตที่จะตอบสนอง .. ดีเราเรียกมันว่าการเติบโตส่วนบุคคล - เพราะพวกเขาจะมาจากคนที่ "วิถีรสนิยม" (และไม่ใช่แค่ "รสนิยมภาพรวม") จะคล้ายกับของคุณ ตอนนี้คำถาม:ฉันสงสัยว่ามีบางสิ่งที่คล้ายกับ "ตัวเลือก 2" อยู่แล้วและถ้าเป็นเช่นนั้นฉันสงสัยว่ามันทำงานอย่างไร และหากไม่มีอยู่คุณสามารถพูดคุยเกี่ยวกับวิธีการใช้งานได้! :)

4
มีวิธีการทางสถิติอะไรบ้างในการแนะนำภาพยนตร์เช่นเดียวกับใน Netflix
ฉันกำลังมองหาที่จะใช้รูปแบบไดนามิกเพื่อแนะนำภาพยนตร์ให้กับผู้ใช้ คำแนะนำควรได้รับการอัปเดตทุกครั้งที่ผู้ใช้ดูภาพยนตร์หรือให้คะแนน เพื่อให้ง่ายฉันคิดว่าการคำนึงถึงปัจจัยสองประการ: การจัดอันดับที่ผ่านมาของภาพยนตร์อื่น ๆ โดยผู้ใช้ เวลาที่ผู้ใช้ดูภาพยนตร์ที่ผ่านมาบางเรื่อง การตั้งค่าหนึ่งแบบนั้นจะเป็นอย่างไรและวรรณกรรมวิชาการแนะนำอะไร ฉันเป็นคนใหม่ในสาขานี้และฉันคาดเดาว่าแบบจำลองการเปลี่ยนทิศทางเชิงเส้นสามารถให้ผลลัพธ์ที่ดีได้โดยไม่ต้องนึกถึงวิธีการที่ซับซ้อนกว่าเพื่อหลีกเลี่ยงความไม่แน่นอนที่ไม่จำเป็นในการประมาณค่าพารามิเตอร์ แต่อาจมีวิธีการที่กำหนดไว้แล้วที่ใช้กันทั่วไปในการปฏิบัติ?

3
ความแตกต่างระหว่างเครื่องแยกตัวประกอบและตัวแยกส่วนแบบ Matrix?
ฉันเจอคำว่าเครื่องแยกตัวประกอบในระบบผู้แนะนำ ฉันรู้ว่า Matrix Factorization สำหรับระบบผู้แนะนำ แต่ไม่เคยได้ยินเกี่ยวกับเครื่องแยกตัวประกอบ ดังนั้นความแตกต่างคืออะไร?

1
สุดยอดแห่งการกรองความร่วมมือ
ฉันกำลังทำงานในโครงการสำหรับการกรองร่วมกัน (CF) เช่นการทำเมทริกซ์ที่สังเกตได้บางส่วนหรือเทนเซอร์ทั่วไป ฉันเป็นมือใหม่ในสนามและสำหรับโครงการนี้ในที่สุดฉันก็ต้องเปรียบเทียบวิธีการของเรากับคนอื่น ๆ ที่รู้จักกันดีว่าทุกวันนี้มีการเปรียบเทียบวิธีที่เสนอกับพวกเขานั่นคือ state-of-the-art การค้นหาของฉันเปิดเผยวิธีการดังต่อไปนี้ แน่นอนฉันเจอพวกเขาโดยดูที่เอกสารเหล่านี้บางส่วนและการอ้างอิงของพวกเขาหรือโดยดูที่ส่วนการทดลองเมื่อพวกเขาทำการเปรียบเทียบ ฉันยินดีที่จะทราบวิธีการเสนอใหม่และทำการเปรียบเทียบกับ SoTA ข้อใดต่อไปนี้เป็นทางเลือกที่ดีที่จะทำ หากไม่ใช่ในหมู่พวกเขาฉันยินดีที่จะรู้จักตัวแทนที่ดี ขึ้นอยู่กับการแยกตัวประกอบเมทริกซ์: การจัดอันดับโดยถ่วงน้ำหนักต่ำ (ICML 2003) การสร้างแบบจำลองโปรไฟล์คะแนนผู้ใช้สำหรับการกรองแบบร่วมมือกัน (NIPS 2003) รูปแบบ Multiplicative Factor หลายตัวสำหรับการกรองแบบร่วมมือกัน (ICML 2004) การแยกตัวประกอบอัตรากำไรขั้นต้นสูงสุดอย่างรวดเร็วสำหรับการคาดการณ์ความร่วมมือ (ICML 2005) การแยกตัวประกอบเมทริกซ์น่าจะเป็น (NIPS 2007) การแยกตัวประกอบเมทริกซ์น่าจะเป็นแบบเบย์ (ICML 2008) แบบจำลองปัจจัยแฝงที่อิงตามการถดถอย (KDD 2009) การแยกตัวประกอบเมทริกซ์แบบไม่เชิงเส้นด้วยกระบวนการเกาส์เซียน (ICML 2009) การแยกตัวประกอบการทรงตัวแบบไดนามิก (การประชุม ACM บนระบบผู้แนะนำ 2015) ขึ้นอยู่กับการแยกตัวประกอบแรงดึง: การรวมข้อมูลบริบทในระบบผู้แนะนำโดยใช้วิธีการหลายมิติ (ธุรกรรม ACM …

2
การแปลงรายการการจัดอันดับบางส่วนเป็นการจัดอันดับโลก
ฉันกำลังทำงานบางอย่างเช่นปัญหาต่อไปนี้ ฉันมีกลุ่มผู้ใช้และหนังสือ N เล่ม ผู้ใช้แต่ละคนสร้างการจัดอันดับตามลำดับของหนังสือทั้งหมดที่เขาอ่าน (ซึ่งน่าจะเป็นชุดย่อยของหนังสือ N) เช่นเล่ม 1> เล่ม 40> เล่ม 25 ตอนนี้ฉันต้องการเปลี่ยนการจัดอันดับผู้ใช้เหล่านี้ให้เป็นอันดับหนึ่งของหนังสือทั้งหมด มีวิธีการที่ดีหรือมาตรฐานที่จะลอง? จนถึงตอนนี้ฉันกำลังนึกถึงโมเดลแบรดลีย์ - เทอร์รี่ที่ใช้ในการเปรียบเทียบแบบคู่ แต่ฉันสงสัยว่ามีอะไรอีกไหม


3
SVD ของเมทริกซ์ที่มีค่าหายไป
สมมติว่าฉันมีเมทริกซ์การแนะนำสไตล์ Netflix และฉันต้องการสร้างแบบจำลองที่ทำนายการจัดอันดับภาพยนตร์ในอนาคตสำหรับผู้ใช้ที่กำหนด การใช้วิธีการของ Simon Funk เราจะใช้การไล่ระดับสีแบบสุ่มสุ่มเพื่อลดบรรทัดฐาน Frobenius ระหว่างเมทริกซ์เต็มและเมทริกซ์ item-by-item * user-by-user ในทางปฏิบัติผู้คนทำอะไรกับค่าที่หายไปจากเมทริกซ์การแนะนำซึ่งเป็นจุดรวมของการคำนวณ ฉันเดาจากการอ่านโพสต์บล็อกของ Simon คือเขาใช้คำที่ไม่หายไปเท่านั้น (ซึ่งประกอบด้วย (พูด) ~ 1% ของเมทริกซ์คำแนะนำ) เพื่อสร้างแบบจำลอง อีก 99% ของเมทริกซ์? ในทางปฏิบัติคุณจะข้ามค่าเหล่านั้นทั้งหมดหรือไม่? หรือคุณสรุปให้มากที่สุดเท่าที่จะทำได้ก่อนที่จะทำการไล่ระดับสีแบบสุ่มสุ่ม? แนวปฏิบัติที่ดีที่สุดมาตรฐานบางประการสำหรับการจัดการกับค่าที่หายไปคืออะไร

1
ความแตกต่างระหว่าง PROC Mixed และ lme / lmer ใน R - degree of freedom
หมายเหตุ: คำถามนี้เป็นคำถามใหม่เนื่องจากต้องลบคำถามก่อนหน้านี้ด้วยเหตุผลทางกฎหมาย ในขณะที่เปรียบเทียบ PROC MIXED จาก SAS กับฟังก์ชันlmeจากnlmeแพ็คเกจใน R ฉันพบความแตกต่างที่ค่อนข้างสับสน โดยเฉพาะอย่างยิ่งองศาอิสระในการทดสอบที่แตกต่างกันระหว่างPROC MIXEDและlmeและฉันสงสัยว่าทำไม เริ่มจากชุดข้อมูลต่อไปนี้ (รหัส R ระบุด้านล่าง): ind: ปัจจัยบ่งชี้บุคคลที่จะทำการวัด fac: อวัยวะที่ใช้ทำการวัด trt: ปัจจัยบ่งชี้การรักษา y: ตัวแปรตอบสนองต่อเนื่องบางอย่าง ความคิดคือการสร้างแบบจำลองง่ายๆดังต่อไปนี้: y ~ trt + (ind): indเป็นปัจจัยสุ่ม y ~ trt + (fac(ind)): facซ้อนกันindเป็นปัจจัยสุ่ม โปรดทราบว่ารุ่นสุดท้ายที่ควรทำให้เกิดเอกเป็นมีเพียง 1 ค่าของyสำหรับการรวมกันของทุกและindfac แบบจำลองแรก ใน SAS ฉันสร้างโมเดลต่อไปนี้: PROC MIXED data=Data; CLASS ind fac …
12 r  mixed-model  sas  degrees-of-freedom  pdf  unbiased-estimator  distance-functions  functional-data-analysis  hellinger  time-series  outliers  c++  relative-risk  absolute-risk  rare-events  regression  t-test  multiple-regression  survival  teaching  multiple-regression  regression  self-study  t-distribution  machine-learning  recommender-system  self-study  binomial  standard-deviation  data-visualization  r  predictive-models  pearson-r  spearman-rho  r  regression  modeling  r  categorical-data  data-visualization  ggplot2  many-categories  machine-learning  cross-validation  weka  microarray  variance  sampling  monte-carlo  regression  cross-validation  model-selection  feature-selection  elastic-net  distance-functions  information-theory  r  regression  mixed-model  random-effects-model  fixed-effects-model  dataset  data-mining 

1
เหตุใดการไม่ปฏิเสธจึงสำคัญสำหรับระบบการกรอง / ผู้แนะนำที่ทำงานร่วมกัน?
ในระบบแนะนำที่ทันสมัยทั้งหมดที่ฉันได้เห็นว่าต้องอาศัยการแยกตัวประกอบแบบเมทริกซ์การแยกตัวประกอบแบบเมทริกซ์ที่ไม่เป็นลบจะดำเนินการกับเมทริกซ์ภาพยนตร์ผู้ใช้ ฉันสามารถเข้าใจได้ว่าทำไมการไม่ปฏิเสธมีความสำคัญต่อการตีความและ / หรือถ้าคุณต้องการปัจจัยที่กระจัดกระจาย แต่ถ้าคุณสนใจเฉพาะการคาดการณ์เท่านั้นเช่นในการแข่งขันชิงรางวัล netflix ทำไมต้องกำหนดข้อ จำกัด ที่ไม่ปฏิเสธ ดูเหมือนว่าจะเลวร้ายยิ่งกว่าการอนุญาตให้มีค่าลบในการแยกตัวประกอบของคุณ กระดาษนี้เป็นหนึ่งในตัวอย่างที่อ้างถึงอย่างสูงของการใช้ตัวประกอบเมทริกซ์ที่ไม่เป็นลบในการกรองร่วมกัน

3
วิธีสร้างระบบผู้แนะนำที่รวมทั้งตัวกรองการทำงานร่วมกันและคุณลักษณะเนื้อหาเข้าด้วยกัน
ฉันกำลังสร้างระบบผู้แนะนำและต้องการรวมทั้งการให้คะแนนของผู้ใช้ที่ "คล้ายกัน" และคุณสมบัติของรายการ เอาท์พุทเป็นคะแนนที่คาดการณ์ไว้ [0-1]. ฉันกำลังพิจารณาเครือข่ายประสาท (เริ่มต้นด้วย) ดังนั้นอินพุตจึงเป็นการรวมกันของคุณสมบัติของรายการและการจัดอันดับของผู้ใช้แต่ละคน สำหรับรายการ A และผู้ใช้ 1 ระบบสามารถฝึกอบรมกับข้อมูลที่รวมกัน A1 ได้ นี่จะเป็นตัวอย่างหนึ่งของการฝึกอบรม เกิดอะไรขึ้นถ้าผู้ใช้ 1 ยังให้คะแนนภาพยนตร์ B ด้วย จากนั้นข้อมูล B1 จะเป็นตัวอย่างการฝึกอบรมด้วยหรือไม่ มีปัญหาในการฝึกอบรมซ้ำกับคุณสมบัติของผู้ใช้ 1 ด้วยวิธีนี้หรือไม่? คุณมีข้อเสนอแนะใด ๆ เกี่ยวกับวิธีที่ดีกว่าในการเข้าถึงปัญหาหรือไม่

2
การกรองความร่วมมือผ่านการแยกตัวประกอบแบบเมทริกซ์ด้วยฟังก์ชันการสูญเสียโลจิสติกส์
พิจารณาปัญหาการกรองร่วมกัน เรามีเมทริกซ์ขนาด # ผู้ใช้ * #items หากผู้ใช้ฉันชอบรายการ j,หากผู้ใช้ฉันไม่ชอบรายการ j และหากไม่มีข้อมูลเกี่ยวกับคู่ (i, j) เราต้องการที่จะทำนายสำหรับผู้ใช้งานในอนาคตคู่ไอเท็มMMMMi,j=1Mi,j=1M_{i,j} = 1Mi,j=0Mi,j=0M_{i,j} = 0Mi,j=?Mi,j=?M_{i,j}=?Mi,jMi,jM_{i,j} วิธีการกรองแบบร่วมมือกันมาตรฐานคือการแสดง M เป็นผลคูณของ 2 เมทริกซ์เช่นน้อยที่สุด (เช่นการลดความคลาดเคลื่อนกำลังสองเฉลี่ยสำหรับองค์ประกอบที่รู้จักของ )U×VU×VU \times V||M−U×V||2||M−U×V||2||M - U \times V||_2MMM สำหรับฉันแล้วฟังก์ชั่นการสูญเสียโลจิสติกส์ดูจะเหมาะสมกว่าทำไมอัลกอริธึมทั้งหมดที่ใช้ MSE
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.