เครื่องแยกตัวประกอบเขตข้อมูล


11

ทุกคนสามารถอธิบายได้ว่าเครื่องแยกตัวประกอบแบบตระหนักถึงสนาม (FFM) เปรียบเทียบกับเครื่องแยกตัวประกอบมาตรฐาน (FM) ได้อย่างไร

มาตรฐาน: http://www.ismll.uni-hildesheim.de/pub/pdfs/Rendle2010FM.pdf

"Field Aware": http://www.csie.ntu.edu.tw/~r01922136/kaggle-2014-criteo.pdf

คำตอบ:


2

ดูเหมือนว่าคุณกำลังขอคำอธิบายระดับสูง หากคุณอ้างถึงสไลด์ที่เชื่อมโยงภายในสไลด์ของโพสต์ดั้งเดิมของคุณจะมีการเปรียบเทียบ FM (สไลด์ 11) กับ FFM (สไลด์ 12)

ตัวอย่างเช่นหากคุณกำลังเรียนรู้เกี่ยวกับผู้ใช้และภาพยนตร์ FM อาจมีปัจจัยต่อไปนี้:

w_{user_1}*w_{movie_1}*... + w{user_1}*w_{genre_1}*...

FFM จะมี:

w_{user_1, movies}*w_{movie_1, users}*... + w{user_1, genres}*w_{genre_1, users}*...

ความแตกต่างที่สำคัญคือใน FM w_{user_1}ค่าสัมประสิทธิ์จะเหมือนกันทั้งสองคำ - มีความคิดเดียวของผู้ใช้ ใน FFM คุณเรียนรู้แยกต่างหากw_{user_1}สำหรับแต่ละบริบทเช่นไม่ว่าจะเป็นการโต้ตอบกับภาพยนตร์หรือประเภท โปรดทราบว่ามันไม่ได้เรียนรู้แยกต่างหากสำหรับภาพยนตร์หรือประเภทเฉพาะ แต่สำหรับภาพยนตร์และแนวเพลงโดยทั่วไป นั่นคือมันจะเรียนรู้บริบทของผู้ใช้สำหรับการโต้ตอบแต่ละประเภทแยกกัน

นอกจากนี้โปรดทราบว่าผู้ใช้w_{movie_1}ไปที่w_{movie_1, users}เนื่องจากคำนั้นโต้ตอบกับw_{user_1}ผู้ใช้


2

สมมติว่า (ก่อนการเข้ารหัสแบบร้อนแรง) คุณมีตัวทำนาย / ฟิลด์จากชุด (พูดประเภทภาพยนตร์เพศผู้ใช้และเชื้อชาติของผู้ใช้) สมมติเพิ่มเติมว่าz predict Zทำนายแต่ละตัวสามารถรับหนึ่งในค่าk z หลังจากการเข้ารหัสหนึ่งร้อนคุณจะมีชุดใหม่ของไบนารีมีXขนาดK : = Σ Z Z k ZZzZkzXK:=zZkz

ในรูปแบบที่มีปฏิสัมพันธ์ที่ทุกท่านต้องประมาณการเมทริกซ์ของการปฏิสัมพันธ์ค่าสัมประสิทธิ์ซึ่งมีK × ( K + 1 ) / 2แง่ที่ไม่ซ้ำกันQK×(K+1)/2

QQWTWWl×K1lKWQ

QQzqzi,zjzi,zjQqzi,zjzi,zjWjTWiWil×KWiQ

QK×lK×l×|Z|K×(K+1)/2


1

เครื่องแยกตัวประกอบมาตรฐานมีฟิลด์ด้วย "ความแปลกใหม่" ที่นี่ดูเหมือนจะเป็นการใช้งานฟีเจอร์ของ GBDT และการประยุกต์ใช้เทคนิคการแฮ็ก ดูเหมือนจะไม่เป็นผลดีมาก: ลองดูประสิทธิภาพในช่วงนาทีสุดท้ายของสไลด์สุดท้าย


ตามที่ผู้เขียนมีแน่นอนลักษณะเขตข้อมูลตระหนักถึงรูปแบบเมื่อเทียบกับการดำเนินการตามมาตรฐาน - มันระบุไว้ในฟอรั่ม kaggle ฉันไม่สามารถทำตามความหมายและความแตกต่างที่แท้จริงได้
B_Miner


จาก slie 14 ปรากฏว่าพวกเขาใช้วิธีการแก้ปัญหาของพวกเขาในบทความนี้ (ทั้งชุดของตัวกรองความร่วมมือและแบบจำลองเชิงวิศวกรรมสำหรับการทำนายอัตราการคลิกผ่าน )
เอ็ม
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.