ฉันกำลังพัฒนาโมเดลเพื่อทำนายยอดขายรวมของผลิตภัณฑ์ ฉันมีข้อมูลการจองประมาณปีครึ่งดังนั้นฉันสามารถทำการวิเคราะห์อนุกรมเวลาได้ อย่างไรก็ตามฉันยังมีข้อมูลจำนวนมากเกี่ยวกับ 'โอกาส' (การขายที่เป็นไปได้) ที่ปิดหรือสูญหาย 'โอกาส' จะถูกดำเนินการไปตามขั้นตอนต่างๆของไปป์ไลน์จนกว่าจะปิดหรือสูญหาย พวกเขายังมีข้อมูลที่เกี่ยวข้องเกี่ยวกับผู้ซื้อที่คาดหวังพนักงานขายประวัติปฏิสัมพันธ์อุตสาหกรรมขนาดการจองโดยประมาณเป็นต้น
เป้าหมายของฉันคือการทำนายการจองทั้งหมดในที่สุด แต่ฉันต้องการข้อมูลทั้งหมดเกี่ยวกับ 'โอกาส' ปัจจุบันซึ่งเป็น 'สาเหตุที่แท้จริง' ของการจอง
หนึ่งความคิดที่ฉันมีคือการใช้สองรุ่นที่แตกต่างกันดังนี้:
ใช้ 'โอกาส' ทางประวัติศาสตร์เพื่อสร้างแบบจำลองที่ทำนายการจองที่เกิดขึ้นจาก 'โอกาส' ของแต่ละบุคคล (ฉันอาจใช้ฟอเรสต์แบบสุ่มหรือแม้แต่การถดถอยเชิงเส้นแบบเก่าธรรมดาสำหรับขั้นตอนนี้)
ใช้แบบจำลองจาก 1 เพื่อทำนายการจอง 'โอกาส' โดยประมาณทั้งหมดในขณะนี้จากนั้นรวมการประมาณการเหล่านั้นตามเดือน 'โอกาส' ที่ถูกสร้างขึ้น
ใช้โมเดลอนุกรมเวลา (อาจเป็น ARIMA) โดยใช้ข้อมูลอนุกรมเวลาย้อนหลังรายเดือน 1.5 ปีและทำนาย (โดยใช้โมเดลจาก 1) การจองทั้งหมดสำหรับ 'โอกาส' ทั้งหมดที่สร้างขึ้นในเดือนนั้น
ได้รับจะมีความล่าช้าในโอกาสเหล่านั้นที่เปลี่ยนไปเป็นการจองจริง แต่โมเดลอนุกรมเวลาควรสามารถจัดการกับความล่าช้าได้
เสียงนี้เป็นอย่างไร ฉันได้อ่านหนังสือตามเวลาและทำนายยอดขายเป็นจำนวนมากและจากสิ่งที่ฉันสามารถบอกได้ว่านี่เป็นวิธีที่ไม่เหมือนใคร ดังนั้นฉันขอขอบคุณข้อเสนอแนะใด ๆ จริงๆ!