ทำนายเวลาที่ดีที่สุดในการโทร


10

ฉันมีชุดข้อมูลรวมถึงชุดลูกค้าในเมืองต่าง ๆ ของรัฐแคลิฟอร์เนียเวลาที่โทรหาลูกค้าแต่ละรายและสถานะการโทร (จริงถ้าลูกค้ารับสายและเท็จถ้าลูกค้าไม่รับสาย)

ฉันต้องหาเวลาที่เหมาะสมในการโทรหาลูกค้าในอนาคตเพื่อให้โอกาสในการตอบรับสูง ดังนั้นกลยุทธ์ที่ดีที่สุดสำหรับปัญหานี้คืออะไร ฉันควรพิจารณาว่าเป็นปัญหาการจำแนกซึ่งชั่วโมง (0,1,2, ... 23) เป็นชั้นเรียนหรือไม่ หรือฉันควรพิจารณาว่าเป็นงานการถดถอยซึ่งเวลาเป็นตัวแปรต่อเนื่องหรือไม่ ฉันจะแน่ใจได้อย่างไรว่าความน่าจะเป็นที่จะรับสายจะสูง

ความช่วยเหลือใด ๆ ที่จะได้รับการชื่นชม มันจะดีมากถ้าคุณอ้างอิงถึงปัญหาที่คล้ายกัน

ด้านล่างนี้เป็นภาพรวมของข้อมูล


ฌอนโอเว่นงานไปได้อย่างไร ตอนนี้ฉันกำลังพยายามแก้ไขปัญหาที่คล้ายกันและอยากจะฟังประสบการณ์ของคุณ - มีทรัพยากรไม่มากนักในหัวข้อนี้บนเว็บ ขอบคุณล่วงหน้า!
Dominika

คำตอบ:


5

คุณอาจประสบปัญหาจริง ๆ ถ้าคุณทำสิ่งนี้เป็นปัญหาการถดถอยโดยไม่มีการแปลงที่เหมาะสม ตัวอย่างเช่นเรารู้ว่าอาจมีการรับสายส่วนใหญ่ในเวลากลางวันและน้อยกว่าในเวลากลางคืนและตอนเช้า การถดถอยเชิงเส้นจะมีปัญหาเพราะความสัมพันธ์นั้นมีแนวโน้มที่จะเป็นเส้นโค้งไม่ใช่เชิงเส้น ด้วยเหตุผลเดียวกันการปฏิบัติต่อสิ่งนี้เป็นงานการจำแนกประเภทที่มีการถดถอยโลจิสติกก็เป็นปัญหาเช่นกัน

ตามที่ผู้ตอบแบบสอบถามคนอื่นแนะนำการจัดประเภทข้อมูลของคุณในช่วงเวลาใหม่จะช่วยได้และฉันขอแนะนำให้คุณลองทำอะไรเช่นต้นไม้ตัดสินใจหรือป่าสุ่มก่อน

ทุกคนพูดว่านี่อาจเป็นกรณีของสถิติเชิงพรรณนาอย่างง่าย หากคุณพล็อตสัดส่วนการรับสายตามเวลาของวัน (แยกตามเมืองหรือกลุ่มประชากรอื่น ๆ ) จะมีเวลาที่ดีที่สุดชัดเจนหรือไม่? ถ้าเป็นเช่นนั้นทำไมต้องทำสิ่งต่าง ๆ ด้วยโมเดล?


1

คุณสามารถลองต่อไปนี้:

  1. แบ่งวันออกเป็นส่วนต่าง ๆ - ตอนเช้าเช้าเที่ยงเที่ยงเย็นเย็นดึกดื่นกลางคืน ฯลฯ
  2. กำหนดขอบเขตเวลาให้กับแต่ละส่วนของวันเช่นเที่ยงอาจเป็นเวลา 12.00 น. ถึง 13.00 น.
  3. สร้างป้ายกำกับใหม่ 3 รายการ - "ส่วนหนึ่งของวันเพื่อโทรหาลูกค้า" สำหรับแต่ละกรณีที่เป็นบวก (สถานะของการโทร = จริง) กำหนดป้ายกำกับที่เกี่ยวข้อง (เช้า / เที่ยง / เย็น) ป้ายกำกับเหล่านี้จะอยู่ในรูปแบบที่เข้ารหัสร้อนแรงเช่น prefer_morning = 0/1, prefer_noon, prefer_evening เป็นต้น
  4. สร้างแบบจำลอง 3 แบบเพื่อทำนายว่าหัวหน้ากลุ่มชอบช่วงเช้า / เที่ยง / หรือช่วงเย็นของวันเพื่อให้การโทรประสบความสำเร็จหรือไม่

นอกจากนี้ฉันขอแนะนำให้เพิ่มคุณสมบัติเพิ่มเติมเช่นอาชีพเพศ ฯลฯ เนื่องจากคุณลักษณะที่ระบุไว้ในตาราง (เมือง ฯลฯ ) นั้นมีความคลุมเครือเกินไปและไม่ให้ข้อมูลที่แตกต่างกันมากสำหรับลูกค้า

แก้ไขตามข้อเสนอแนะในความคิดเห็น:

เมื่อใช้แบบจำลองแต่ละโอกาสในการขายจะได้รับการจัดประเภทเป็น prefers_morning = ใช่ / ไม่ใช่, prefers_noon = ใช่ / ไม่ใช่และ prefers_evening = ใช่ / ไม่ใช่ ขึ้นอยู่กับช่วงเวลาของวันตัวอย่างเช่นในตอนเช้าตัวแทนศูนย์บริการข้อมูล (หรือซอฟต์แวร์) สามารถเลือกและนำไปสู่การโทรที่จัดประเภทไว้ในชุดการตั้งค่าตอนเช้า เมื่อถึงตอนเที่ยงซอฟต์แวร์การโทรจะเลือกรายการที่ต้องการในตอนเที่ยงและอื่น ๆ


@ sandeep-s-sandhu นี่เป็นวิธีที่ง่ายในการแปลงปัญหาเป็นปัญหาการจัดหมวดหมู่ข้อมูลวิทยาศาสตร์ แต่ดูเหมือนว่าวิธีการนี้อาจมีข้อเสียบางประการ: 1. ข้อมูลฉลากมีเฉพาะกรณีที่เป็นบวกการสูญเสียข้อมูลของกรณีที่เป็นลบ 2. ลูกค้าสามารถมีหนึ่งในฉลากเท่านั้น ในทางปฏิบัติลูกค้าสามารถมีป้ายกำกับได้มากกว่าหนึ่งป้าย (เช่นฉันต้องการคนที่โทรหาฉันตอนดึกหรือค่ำ) คุณคิดอย่างไร?
nkhuyu

@nkhuyu, 1) ฉลากยังมีตัวพิมพ์เล็ก ฉันคิดว่าคุณเข้าใจผิดเกี่ยวกับข้อความ "สร้างป้ายกำกับใหม่ -" ส่วนหนึ่งของวันเพื่อโทรหาลูกค้า "สำหรับแต่ละกรณีที่เป็นบวก (สถานะของการโทร = จริง)" ขั้นตอนนี้มุ่งมั่นที่จะสร้างป้ายกำกับเพิ่มเติมป้ายชื่อเดิมว่าการโทรสำเร็จหรือไม่ยังคงเป็นตามเดิม 2) ใช่ถูกต้องแล้วแก้ไขคำตอบเพื่อสะท้อนสิ่งนี้
Sandeep S. Sandhu

@ sandeep-s-sabdhu ขอบคุณสำหรับการตอบกลับ ใช่ฉันเข้าใจผิด ตกลง. จากนั้นคุณจะมีสองป้ายกำกับ (สถานะการโทร, ป้ายกำกับใหม่ของคุณ) แล้วคุณจะแก้ปัญหานี้ได้อย่างไร มันไม่ใช่ปัญหาการจำแนกประเภทปกติ
nkhuyu

@nkhuyu ขอบคุณที่สังเกตสิ่งนี้ฉันได้แก้ไขและชี้แจงสิ่งนี้ในขั้นตอนที่ # 4 ทั้งสามรุ่นจะมีกลุ่มผู้นำที่จะเลือกสายสำหรับช่วงเวลานั้นของวันนั้นศูนย์บริการจะใช้สิ่งนี้เพื่อจัดลำดับความสำคัญการโทรของพวกเขา
Sandeep S. Sandhu

1
ขั้นตอนที่ 1 ตามด้วยขั้นตอนที่ 3 และฉันแนะนำให้สร้างป้ายกำกับที่เหมาะสมสำหรับการฝึกอบรม คำถามหลักคือ - "ฉันต้องหาเวลาที่เหมาะสมในการโทร ... " มันขึ้นอยู่กับ OP เพื่อตัดสินใจว่าสิ่งเหล่านี้ควรจะเป็นตอนเช้า / เที่ยง / ตอนเย็นหรือละเอียดกว่าเช่นชั่วโมง
Sandeep S. Sandhu

0

ฉันจะใช้การถดถอยโลจิสติก - คุณจะต้องการตัวอย่างที่พวกเขาไม่ได้รับ จากนั้นฉันจะปฏิบัติต่อชั่วโมงในฐานะตัวแทนหุ่นจำลองตามฤดูกาล (23 ชั่วโมงเป็นตัวแปรหุ่นจำลองและปล่อยให้หนึ่งครั้งไหลไปที่จุดตัด)

ถ้าคุณไม่ถือว่ามันเป็นตัวจำลองแบบตัวเต็มฤดูกาลคุณจะต้องทำการเปลี่ยนแปลงบางอย่างเนื่องจากความสัมพันธ์จะไม่เป็นเชิงเส้น

มีคนแนะนำก่อนหน้านี้แทนช่วงบ่าย ฯลฯ เป็นตัวแปรเด็ดขาด นั่นเป็นความคิดที่ไม่ดีเพราะคุณมีรายละเอียดและคุณสูญเสียรายละเอียดที่นั่น นั่นจะมีผลที่คล้ายกันกับการใช้การ binning ที่เหมาะสมที่สุดเพื่อสร้างความสัมพันธ์เชิงเส้น แต่ฉันก็ยังไม่คิดว่ามันจะใช้ได้ ลองใช้ตัวจำลองตามฤดูกาล

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.