วิธีจำลองพฤติกรรมการซื้อของผู้ใช้ใน Amazon


9

สำหรับโครงการหลักสูตรสุดท้ายของเราในวิทยาศาสตร์ข้อมูลเราเสนอดังต่อไปนี้ -

ให้ชุดข้อมูลบทวิจารณ์ของ Amazonเราวางแผนที่จะคิดอัลกอริทึม (นั่นคือคร่าวๆตาม Personalized PageRank) ที่กำหนดตำแหน่งเชิงกลยุทธ์สำหรับการวางโฆษณาใน Amazon ตัวอย่างเช่นมีผลิตภัณฑ์นับล้านรายการใน Amazon และชุดข้อมูลจะให้ข้อมูลเกี่ยวกับผลิตภัณฑ์ที่เกี่ยวข้องผลิตภัณฑ์ที่นำมารวมกันดูด้วยกันเป็นต้น (เราสามารถสร้างกราฟพร้อมข้อมูลที่ดูได้และซื้อด้วย) นอกจากนี้ยังให้บทวิจารณ์ที่เกี่ยวข้องกับผลิตภัณฑ์แต่ละชิ้นผ่าน 14 ปี ใช้ข้อมูลเหล่านี้ทั้งหมดเราจะให้คะแนน / จัดอันดับผลิตภัณฑ์ใน Amazon ตอนนี้คุณเป็นผู้ขายใน Amazon ที่ต้องการปรับปรุงปริมาณการใช้งานไปยังหน้าผลิตภัณฑ์ของพวกเขา อัลกอริทึมของเราช่วยให้คุณระบุตำแหน่งเชิงกลยุทธ์ในกราฟที่คุณสามารถวางโฆษณาของคุณเพื่อให้คุณได้รับอัตราการเข้าชมสูงสุด

ตอนนี้คำถามของศาสตราจารย์คือคุณจะตรวจสอบอัลกอริทึมของคุณโดยไม่มีผู้ใช้จริงได้อย่างไร พวกเราพูด-

เราสามารถสร้างแบบจำลองชุดผู้ใช้ที่แน่นอน ผู้ใช้บางคนติดตามalso_boughtและalso_viewedเชื่อมโยงไปยังการกระโดดครั้งที่สามบ่อยกว่าการกระโดดครั้งแรกหรือครั้งที่ห้า มีการกระจายพฤติกรรมของผู้ใช้ตามปกติ ผู้ใช้บางคนแทบไม่มีการนำทางใด ๆ เลยหลังจากกระโดดครั้งแรก พฤติกรรมของผู้ใช้ชุดนี้มีการกระจายชี้แจง

ศาสตราจารย์ของเรากล่าวว่า - ไม่ว่าผู้ใช้จะปฏิบัติตามสิ่งใดก็ตามผู้ใช้นำทางโดยใช้ลิงก์สำหรับผลิตภัณฑ์ที่คล้ายกัน อัลกอริทึมการจัดอันดับของคุณพิจารณาผลิตภัณฑ์ b / w 2 ที่คล้ายคลึงกันเพื่อจัดอันดับผลิตภัณฑ์ ดังนั้นการใช้อัลกอริทึมการตรวจสอบนี้จึงเป็นเรื่องcheatingจริง มาพร้อมกับพฤติกรรมของผู้ใช้อื่น ๆ ซึ่งมีความสมจริงและตั้งฉากกับอัลกอริทึมมากขึ้น

มีความคิดเห็นเกี่ยวกับวิธีจำลองพฤติกรรมของผู้ใช้อย่างไร ฉันยินดีที่จะให้รายละเอียดเพิ่มเติมเกี่ยวกับอัลโก

คำตอบ:


1

คุณจะตรวจสอบอัลกอริทึมของคุณอย่างไร?

แทนที่จะพยายามตอบคำถามที่สองพิจารณาว่าคำตอบของคุณสำหรับคำถามแรกอาจต้องมีการแก้ไข ...

คุณใช้วิธีใดในการตรวจสอบวิธีการเรียนรู้ตลอดชั้นเรียนวิทยาศาสตร์ข้อมูลของคุณ ก่อนอื่นคุณต้องกำหนดชุดตัวเลขเฉพาะเพื่อประเมินความสำเร็จหรือความล้มเหลวของแบบจำลองของคุณ ประการที่สองวิธีการใดที่คุณสามารถใช้เพื่อสร้างประชากรการทดสอบที่สมจริงมาก (สมจริงกว่าการสร้างแบบจำลองประชากร) คำใบ้แรกที่ฉันจะให้คือชุดข้อมูลรีวิว Amazonมีขนาดใหญ่มากดังนั้นข้อมูลของคุณจึงสามารถแก้ไขได้ด้วยวิธีนี้ คำใบ้ที่สองที่ฉันจะให้คือวิธีนี้น่าจะเป็นวิธีที่คุณใช้ใน 95% ของปัญหาการเรียนรู้ภายใต้การดูแลที่คุณได้ทำงานในชั้นเรียน ...

หวังว่าสิ่งนี้จะช่วย ... ฉันจะแก้ไขสิ่งนี้หากจำเป็นต้องขึ้นอยู่กับความคิดเห็นที่เพิ่มโดย OP แต่ไม่ต้องการให้แก้ปัญหาทันทีเพื่อที่จะล้วงเอาความคิดทั่วไปเช่นนี้เป็นปัญหาในชั้นเรียนและศาสตราจารย์คือ พยายามที่จะช่วยคุณหาทางออกที่ถูกต้องด้วยตัวคุณเอง


0

มีข้อกำหนดสองประการสำหรับรูปแบบพฤติกรรมที่คุณควรใช้: (1) "สมจริงยิ่งขึ้น" และ (2) มุมฉากของอัลกอริทึมของคุณ

(1) ตามความเป็นจริงให้เราคิดว่ามันหมายถึงพฤติกรรมที่ควรสะท้อนพฤติกรรมที่พบในบริบทอื่น ๆ ที่กว้างกว่าบริบทที่เฉพาะเจาะจงของการซื้อของ Amazon

(2) มุมฉากมีความเข้าใจที่ตรงไปตรงมามากกว่า พฤติกรรมแบบจำลองไม่ควรขับเคลื่อนด้วยความคล้ายคลึงกันระหว่างผลิตภัณฑ์

วิธีง่ายๆในการตอบสนองความต้องการทั้งสองนี้มาจากข้อเท็จจริงที่ว่าพฤติกรรมการซื้อนั้นขับเคลื่อนด้วยลักษณะทางสังคมและประชากรเช่นเพศอายุสถานที่ (เช่นเขตเมือง / ชนบท) และข้อ จำกัด ทางเศรษฐกิจ (รายได้และราคา)

คุณมีชุดผู้ใช้และชุดผลิตภัณฑ์ คุณสามารถประเมินความสัมพันธ์ระหว่างตัวแปรทางสังคมและความต้องการผลิตภัณฑ์โดยใช้เทคนิคการถดถอยที่เรียบง่าย แต่ระวัง หากจำเป็นคุณสามารถใช้แหล่งข้อมูลภายนอกเพื่อกำหนดสมมติฐานเกี่ยวกับตัวแปรที่ขาดหายไปที่สำคัญเช่นรายได้

จากนั้นหากคุณเป็นผู้ขายรูปแบบทางสังคมและประชากรจะคาดการณ์ว่ากลุ่มใดน่าจะซื้อผลิตภัณฑ์ของคุณมากที่สุด

ฉันหวังว่าจะช่วย :)

เบน

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.