Forecastability
คุณถูกต้องว่านี่เป็นคำถามของการคาดการณ์ มีการไม่กี่บทความใน forecastabilityในIIF ของผู้ประกอบการที่มุ่งเน้นวารสารสุขุม (การเปิดเผยแบบเต็ม: ฉันเป็นผู้แก้ไขที่เกี่ยวข้อง)
ปัญหาคือการคาดการณ์นั้นยากที่จะประเมินในกรณี "ง่าย"
ตัวอย่างเล็ก ๆ น้อย ๆ
สมมติว่าคุณมีซีรี่ส์เวลาเช่นนี้ แต่ไม่พูดภาษาเยอรมัน:
คุณจะสร้างแบบจำลองจุดสูงสุดขนาดใหญ่ในเดือนเมษายนได้อย่างไรและคุณจะรวมข้อมูลนี้ไว้ในการคาดการณ์อย่างไร
ถ้าคุณไม่ทราบว่าชุดเวลานี้คือการขายไข่ในเครือซุปเปอร์มาร์เก็ตของสวิสซึ่งยอดเขาอยู่ตรงหน้าปฏิทินอีสเตอร์ตะวันตกคุณจะไม่มีโอกาสเลย ยิ่งไปกว่านั้นเมื่ออีสเตอร์เคลื่อนไปรอบ ๆ ปฏิทินประมาณหกสัปดาห์การคาดการณ์ใด ๆ ที่ไม่รวมวันที่เฉพาะของเทศกาลอีสเตอร์ (โดยสมมติว่านี่เป็นเพียงจุดสูงสุดตามฤดูกาลที่จะเกิดขึ้นอีกในสัปดาห์ถัดไป) อาจจะปิดมาก
ในทำนองเดียวกันสมมติว่าคุณมีเส้นสีน้ำเงินด้านล่างและต้องการสร้างแบบจำลองสิ่งที่เกิดขึ้นใน 2010-02-28 ดังนั้นจึงแตกต่างจากรูปแบบ "ปกติ" ใน 2010-02-27:
อีกครั้งโดยไม่รู้ว่าเกิดอะไรขึ้นเมื่อทั้งเมืองที่เต็มไปด้วยชาวแคนาดาดูเกมการแข่งขันฮ็อกกี้น้ำแข็งรอบชิงชนะเลิศทางทีวีคุณไม่มีโอกาสเข้าใจสิ่งที่เกิดขึ้นที่นี่และคุณจะไม่สามารถคาดเดาได้ว่าจะเกิดอะไรขึ้น
สุดท้ายให้ดูที่:
นี่คือช่วงเวลาของการขายประจำวันที่Cash and Carryร้าน (ทางขวาคุณมีตารางง่ายๆ: 282 วันมียอดขายเป็นศูนย์ 42 วันเห็นยอดขาย 1 ... และอีกวันหนึ่งมียอดขาย 500. ) ฉันไม่รู้ว่ามันคืออะไร
จนถึงวันนี้ฉันไม่รู้ว่าเกิดอะไรขึ้นในวันหนึ่งด้วยยอดขาย 500 ข้อเดาที่ดีที่สุดของฉันคือลูกค้าบางคนสั่งซื้อสินค้าจำนวนมากล่วงหน้าก่อน ตอนนี้โดยไม่ทราบสิ่งนี้การพยากรณ์ใด ๆ สำหรับวันนี้จะห่างไกล ในทางกลับกันสมมติว่าสิ่งนี้เกิดขึ้นก่อนวันอีสเตอร์และเรามีอัลกอริธึมโง่ที่เชื่อว่านี่อาจเป็นผลอีสเตอร์ โอ้นั่นอาจจะผิดไป
สรุป
ในทุกกรณีเราจะเห็นว่าการคาดการณ์สามารถเข้าใจได้ดีเพียงใดเมื่อเรามีความเข้าใจอย่างลึกซึ้งเพียงพอในปัจจัยที่มีผลต่อข้อมูลของเรา ปัญหาคือว่าถ้าเราไม่ทราบปัจจัยเหล่านี้เราไม่ทราบว่าเราอาจไม่รู้จักพวกเขา ตามDonald Rumsfeld :
[T] ที่นี่เป็นที่รู้จักกันดี มีบางสิ่งที่เรารู้ว่าเรารู้ นอกจากนี้เรายังรู้ว่ามีสิ่งแปลกปลอมที่รู้จัก กล่าวคือเรารู้ว่ามีบางสิ่งที่เราไม่รู้ แต่ก็มีสิ่งแปลกปลอมที่ไม่ทราบ - สิ่งที่เราไม่รู้เราไม่รู้
หากเราไม่ทราบความพึงพอใจของเทศกาลอีสเตอร์หรือแคนาดาสำหรับฮอกกี้เราก็ติดอยู่ - และเราไม่มีทางไปข้างหน้าเพราะเราไม่รู้ว่าเราต้องถามคำถามอะไร
วิธีเดียวในการจัดการกับสิ่งเหล่านี้คือการรวบรวมความรู้เกี่ยวกับโดเมน
สรุปผลการวิจัย
ฉันได้ข้อสรุปสามข้อจากนี้:
- คุณมักจะต้องรวมความรู้ในการสร้างแบบจำลองและการทำนายของคุณ
- แม้ว่าจะมีความรู้เกี่ยวกับโดเมนคุณก็ไม่สามารถรับประกันได้ว่าจะได้รับข้อมูลที่เพียงพอสำหรับการคาดการณ์และการคาดการณ์ของคุณเพื่อให้ผู้ใช้ยอมรับได้ ดูว่าผิดขอบเขตด้านบน
- หาก "ผลลัพธ์ของคุณมีความสุข" คุณอาจหวังมากกว่าที่คุณจะทำได้ หากคุณคาดการณ์การโยนเหรียญอย่างยุติธรรมแสดงว่าไม่มีความแม่นยำสูงกว่า 50% อย่าเชื่อถือมาตรฐานความถูกต้องของการพยากรณ์ภายนอกเช่นกัน
บรรทัดล่าง
นี่คือวิธีที่ฉันจะแนะนำแบบจำลองอาคาร - และสังเกตว่าจะหยุดเมื่อใด:
- พูดคุยกับใครบางคนที่มีความรู้เกี่ยวกับโดเมนถ้าคุณยังไม่มีตัวคุณเอง
- ระบุตัวขับเคลื่อนหลักของข้อมูลที่คุณต้องการคาดการณ์รวมถึงการติดต่อที่น่าจะเป็นไปตามขั้นตอนที่ 1
- สร้างแบบจำลองซ้ำ ๆ รวมถึงไดรเวอร์ในลำดับที่ลดลงของความแข็งแรงตามขั้นตอนที่ 2 ประเมินโมเดลโดยใช้การตรวจสอบความถูกต้องแบบไขว้หรือตัวอย่างตัวอย่าง
- หากความแม่นยำในการทำนายของคุณไม่เพิ่มขึ้นอีกให้กลับไปที่ขั้นตอนที่ 1 (เช่นโดยการระบุการคาดคะเนผิดพลาดอย่างโจ่งแจ้งคุณไม่สามารถอธิบายได้และพูดคุยกับผู้เชี่ยวชาญด้านโดเมน) หรือยอมรับว่าคุณมาถึงจุดสิ้นสุด ความสามารถของโมเดล วิเคราะห์เวลาของคุณล่วงหน้าช่วย
โปรดทราบว่าฉันไม่สนับสนุนให้ลองรุ่นที่แตกต่างกันหากรุ่นต้นแบบของคุณมีปัญหา โดยทั่วไปหากคุณเริ่มต้นด้วยแบบจำลองที่สมเหตุสมผลการใช้บางสิ่งที่ซับซ้อนกว่านั้นจะไม่ได้ประโยชน์มากนักและอาจเป็น "การใส่ชุดทดสอบมากเกินไป" ฉันได้เห็นนี้บ่อยและคนอื่น ๆ เห็นด้วย