เป็นไปได้หรือไม่ที่จะเข้าใจโมเดลของ pareto / nbd


12

ฉันกำลังเรียนรู้ที่จะใช้แพ็คเกจ BTYD ที่ใช้โมเดล Pareto / NBD เพื่อคาดการณ์ว่าลูกค้าจะกลับมาเมื่อใด อย่างไรก็ตามวรรณคดีทั้งหมดในรุ่นนี้เต็มไปด้วยคณิตศาสตร์และดูเหมือนจะไม่มีคำอธิบายง่ายๆ / แนวคิดเกี่ยวกับการทำงานของรุ่นนี้ เป็นไปได้หรือไม่ที่จะเข้าใจโมเดล Pareto / NBD สำหรับผู้ที่ไม่ใช่นักคณิตศาสตร์ ฉันได้อ่านบทความที่มีชื่อเสียงนี้โดยเฟดเดอร์ โมเดล Pareto / NBD สร้างสมมติฐานดังต่อไปนี้:

ผม. ในขณะที่ใช้งานจำนวนของการทำธุรกรรมที่ทำโดยลูกค้าในช่วงระยะเวลาที่มีความยาว t มีการกระจายปัวซองด้วยอัตราการทำธุรกรรมλ

ii ความแตกต่างในอัตราการทำธุรกรรมทั่วลูกค้าจะเป็นไปตามการแจกแจงแกมม่าด้วยพารามิเตอร์รูปร่าง r และพารามิเตอร์สเกลα

สาม. ลูกค้าแต่ละรายมีความยาว“ ตลอดชีพ” ที่ไม่ได้สังเกตเห็น จุดนี้ที่ลูกค้าไม่ใช้งานจะมีการแจกแจงแบบเอ็กซ์โพเนนเชียลด้วยอัตราการออกกลางคัน µ

iv) ความหลากหลายในอัตราการออกกลางคันของลูกค้าตามการกระจายของแกมม่าด้วยพารามิเตอร์รูปร่างและพารามิเตอร์สเกลβ

v. อัตราการทำธุรกรรมλและอัตราการออกกลางคัน µ แตกต่างกันไปตามลูกค้า "

ฉันไม่เข้าใจเหตุผลของการตั้งสมมติฐาน (ii), (iii) และ (iv) เหตุใดจึงมีเพียงการกระจายเหล่านี้ทำไมจึงไม่ใช่คนอื่น

นอกจากนี้สมมติฐานของรุ่น BG / NBD คือ:

i.) ในขณะที่ใช้งานจำนวนธุรกรรมที่ลูกค้าทำตามกระบวนการปัวซองด้วยอัตราธุรกรรม transaction สิ่งนี้เทียบเท่ากับการสมมติว่าเวลาระหว่างธุรกรรมถูกแจกแจงแบบเอ็กซ์โพเนนเชียลด้วยอัตราธุรกรรมλ

ii) ความหลากหลายในλติดตามการแจกแจงแกมม่า

iii) หลังจากการทำธุรกรรมใด ๆ ลูกค้าจะไม่ใช้งานด้วยความน่าจะเป็น p ดังนั้นจุดที่ลูกค้า "หลุดออก" จะถูกกระจายข้ามการทำธุรกรรมตามการกระจายทางเรขาคณิต (เลื่อน) ด้วย pmf

iv) ความหลากหลายใน p ติดตามการแจกแจงแบบเบต้า

เหตุผล (ใช้งานง่าย) ของสมมติฐาน (ii), (iii) และ (iv) ก็ไม่ชัดเจนเช่นกัน

ฉันจะขอบคุณสำหรับความช่วยเหลือใด ๆ ขอบคุณ


คุณช่วยเพิ่มการอ้างอิงถึงวรรณกรรมที่คุณพบว่ายากได้ไหม?
kjetil b halvorsen

ฉันได้อธิบายอย่างละเอียดถึงสิ่งที่ไม่ชัดเจน ฉันรู้ว่ามันไม่ใช่เรื่องง่ายที่จะนำปรีชามาเล่น แต่ถ้าเป็นไปได้มันจะช่วยได้มาก ขอบคุณ
user3282777

คำตอบ:


14

ลองจินตนาการว่าคุณเป็นผู้จัดการร้านดอกไม้ที่ได้รับการแต่งตั้งใหม่ คุณมีประวัติลูกค้าปีที่ผ่านมา - ความถี่ที่พวกเขาซื้อสินค้าและนานแค่ไหนนับตั้งแต่การเยี่ยมชมครั้งสุดท้ายของพวกเขา คุณต้องการที่จะรู้ว่าลูกค้าที่จดทะเบียนในธุรกิจมีแนวโน้มที่จะนำมาในปีนี้ มีบางสิ่งที่ควรพิจารณา:

[สมมติฐาน (ii)] ลูกค้ามีพฤติกรรมการช็อปปิ้งที่แตกต่างกัน

บางคนชอบมีดอกไม้สดตลอดเวลาในขณะที่คนอื่น ๆ เท่านั้นในโอกาสพิเศษ มันสมเหตุสมผลมากกว่าที่จะมีการแจกแจงสำหรับอัตราการทำธุรกรรมแทนที่จะสมมติว่าเดียวอธิบายพฤติกรรมของทุกคนλλλ

การกระจายต้องมีพารามิเตอร์เล็กน้อย (คุณไม่จำเป็นต้องมีข้อมูลจำนวนมาก) เพื่อให้มีความยืดหยุ่นพอสมควร (สมมุติว่าคุณไม่ใช่กูรูผู้ประกอบการอ่านใจและไม่รู้จักนิสัยการซื้อของ) ค่าในจำนวนจริงบวก การแจกแจงแกมมาจะทำเครื่องหมายในกล่องเหล่านั้นทั้งหมดและได้รับการศึกษาเป็นอย่างดีและใช้งานง่าย มันมักจะใช้เป็นพารามิเตอร์สำหรับล่วงหน้าในการตั้งค่าที่แตกต่างกัน

[สมมติฐาน (iii)] คุณอาจสูญเสียลูกค้าบางรายไปแล้วในรายการ

หาก Andrea ซื้อดอกไม้ประมาณเดือนละครั้งทุกเดือนในปีที่ผ่านมามันเป็นวิธีที่ปลอดภัยพอสมควรที่เธอจะกลับมาในปีนี้ ถ้าเบ็นเคยซื้อดอกไม้ทุกสัปดาห์ แต่เขาไม่ได้อยู่มานานหลายเดือนบางทีเขาอาจพบร้านขายดอกไม้ที่แตกต่างออกไป ในการจัดทำแผนธุรกิจในอนาคตคุณอาจต้องพึ่งพา Andrea แต่ไม่ใช่ใน Ben

ลูกค้าจะไม่บอกคุณว่าเมื่อใดที่พวกเขาเดินหน้าต่อไปซึ่งเป็นที่มาของข้อสมมติที่ว่า ลองนึกภาพลูกค้าคนที่สามแครี แบบจำลอง Pareto / NBD และ BG / NBD ให้สองวิธีที่แตกต่างกันในการคิดถึง Cary ที่ปล่อยออกมาจากร้านเพื่อผลที่ดี

สำหรับกรณีของ Pareto / NBD ให้จินตนาการว่า ณ เวลาใดเวลาหนึ่งมีโอกาสเล็กน้อยที่ Cary อาจเจอร้านค้าที่ดีกว่าของคุณ ความเสี่ยงที่น้อยครั้งนี้ทำให้คุณมีชีวิตแบบเอกซ์โปเนนเชียล - และยิ่งนานขึ้นนับตั้งแต่ครั้งสุดท้ายที่เขามาเยี่ยมแครี่อีกต่อไปเขายิ่งได้รับความสนใจจากร้านดอกไม้อื่น ๆ

กรณี BG / NBD เป็นสิ่งที่ทำขึ้นมาเล็กน้อย ทุกครั้งที่แครีมาถึงร้านของคุณเขามุ่งมั่นที่จะซื้อดอกไม้ ในขณะที่กำลังดูเขาจะพิจารณาการเปลี่ยนแปลงของราคาคุณภาพและความหลากหลายตั้งแต่การเข้าชมครั้งสุดท้ายของเขาและในที่สุดจะทำให้เขาตัดสินใจว่าจะกลับมาอีกครั้งในครั้งต่อไปหรือมองหาร้านค้าอื่น ดังนั้นแทนที่จะเสี่ยงตลอดเวลานิวเคลียสมีโอกาสที่จะตัดสินใจออกจากการซื้อแต่ละครั้ง

[สมมติฐาน (iv)] ลูกค้าทุกคนไม่ได้มีข้อผูกพันต่อร้านค้าของคุณ

ลูกค้าบางรายเป็นปกติและมีเพียงความตาย - หรือการเพิ่มขึ้นของราคาอย่างรุนแรง - จะบังคับให้พวกเขาออกไป คนอื่นอาจต้องการสำรวจและจะทิ้งคุณไว้อย่างมีความสุขเพราะร้านดอกไม้ทันสมัยที่อยู่ตรงข้ามถนน แทนที่จะเป็นอัตราการออกกลางคันเพียงครั้งเดียวสำหรับลูกค้าทุกคนมันสมเหตุสมผลมากกว่าที่จะมีการกระจายของอัตราการออกกลางคัน (หรือความน่าจะเป็นในกรณี BG / NBD)

วิธีนี้ใช้งานได้ดีในหลอดเลือดดำเดียวกับพฤติกรรมการซื้อของ เรากำลังทำการแจกจ่ายที่ยืดหยุ่นและเป็นที่ยอมรับโดยมีพารามิเตอร์น้อย ในกรณี Pareto / NBD เราใช้ Gamma เนื่องจากอัตราอยู่ในจำนวนจริงบวก ในกรณี BG / NBD เราใช้ Beta ซึ่งเป็นมาตรฐานก่อนสำหรับพารามิเตอร์ใน1)( 0 ; 1 )μ(0;1)

ฉันหวังว่านี่จะช่วยได้. ดูเอกสารต้นฉบับ (Schmittlein et al., 1987) หากคุณยังไม่ได้อ่าน - พวกเขาผ่านสัญชาตญาณบางอย่างที่นั่น


ขอบคุณสำหรับการทำงานหนักและคำอธิบายที่ชัดเจน เหตุผลในการใช้การแจกแจงแกมมานั้นค่อนข้างง่ายต่อการใช้งานและมักใช้เป็นพารามิเตอร์เชิงบวกก่อนหน้าในการตั้งค่าที่แตกต่างกัน ในขณะที่รูปร่างของการแจกแจงแกมม่าส่วนใหญ่ (ด้วยค่าพารามิเตอร์ที่แตกต่างกัน) นั้นง่ายต่อการเข้าใจ แต่เพื่อให้สอดคล้องกับ 'ความหลากหลายในอัตราการทำธุรกรรมระหว่างลูกค้า' กับการกระจายแกมม่าที่เกือบจะตกหลุมแทน (สำหรับ k = 1, theta = 2 ที่นี่] en.wikipedia.org/wiki/Gamma_distribution ) ยากที่จะเข้าใจ เราไม่รวมพฤติกรรมดังกล่าวหรือไม่
user3282777

1
ค่าประมาณของคุณสำหรับพารามิเตอร์แกมมาจะขึ้นอยู่กับข้อมูลที่คุณใช้งาน ประเด็นทั้งหมดคือการแจกแจงแกมมาสามารถมีรูปร่างที่แตกต่างกันอย่างมีนัยสำคัญโดยอิงจากพารามิเตอร์สองตัวเท่านั้นและคุณสามารถปล่อยให้ข้อมูลพูดได้เองโดยไม่ต้องใช้สมมติฐานที่เข้มงวดมากเกินไป (มากหรือน้อย)
Lyuba B.
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.