ในการตัดสินใจว่าจะใช้มาตรการการคาดการณ์ข้อผิดพลาดแบบใดเราต้องย้อนกลับไป โปรดทราบว่าเราไม่ทราบผลลัพธ์ในอนาคตอย่างสมบูรณ์แบบและเราจะไม่เคย ดังนั้นผลในอนาคตต่อไปนี้การกระจายความน่าจะเป็น วิธีการคาดการณ์บางวิธีส่งออกการแจกแจงแบบเต็มอย่างชัดเจนและบางวิธีก็ไม่ทำเช่นนั้น แต่จะมีอยู่เสมอหากโดยปริยาย
ตอนนี้เราต้องการที่จะมีมาตรการข้อผิดพลาดที่ดีสำหรับการคาดการณ์จุด การคาดคะเนจุดดังกล่าวFtคือความพยายามของเราที่จะสรุปสิ่งที่เรารู้เกี่ยวกับการแจกแจงในอนาคต (เช่นการแจกแจงการทำนาย) ณ เวลาที่tโดยใช้หมายเลขเดียวฟังก์ชันที่เรียกว่าความหนาแน่นในอนาคต การวัดความผิดพลาดเป็นวิธีหนึ่งในการประเมินคุณภาพของการสรุปตัวเลขเดี่ยวนี้
ดังนั้นคุณควรเลือกการวัดข้อผิดพลาดที่ให้ผลสรุปตัวเลข "ดี" หนึ่งหมายเลขของความหนาแน่นในอนาคต (ไม่ทราบอาจคาดการณ์ แต่อาจเป็นเพียงนัย) ความหนาแน่นในอนาคต
ความท้าทายคือการวัดความผิดพลาดที่แตกต่างกันจะถูกย่อให้เล็กสุดโดยฟังก์ชันที่แตกต่างกัน MSE ที่คาดหวังจะถูกย่อให้เล็กสุดโดยค่าที่คาดหวังของการกระจายในอนาคต MAD ที่คาดหวังจะถูกย่อให้เล็กสุดโดยค่ามัธยฐานของการแจกแจงในอนาคต ดังนั้นหากคุณปรับการคาดการณ์ของคุณให้เหลือน้อยที่สุดการคาดคะเนจุดของคุณจะเป็นค่ามัธยฐานในอนาคตไม่ใช่ค่าที่คาดหวังในอนาคตและการคาดการณ์ของคุณจะลำเอียงหากการกระจายในอนาคตของคุณไม่สมมาตร
สิ่งนี้มีความเกี่ยวข้องมากที่สุดสำหรับข้อมูลการนับซึ่งโดยทั่วไปจะเบ้ ในกรณีที่รุนแรง (พูดว่าปัวซองกระจายยอดขายโดยมีค่าเฉลี่ยต่ำกว่าเข้าสู่ระบบ2 ≈ 0.69 ) แม่ของคุณจะต่ำที่สุดสำหรับการคาดการณ์ที่ไม่เป็นศูนย์ ดูที่นี่หรือที่นี่หรือที่นี่เพื่อดูรายละเอียด
ฉันให้ข้อมูลเพิ่มเติมและภาพประกอบในข้อบกพร่องของข้อผิดพลาดค่าเฉลี่ยสัมบูรณ์ร้อยละ (MAPE) คืออะไร เธรดนั้นพิจารณาmapeแต่ยังรวมถึงข้อผิดพลาดอื่น ๆ และมีลิงก์ไปยังเธรดที่เกี่ยวข้องอื่น ๆ
ในท้ายที่สุดการวัดความผิดพลาดที่ใช้จริงขึ้นอยู่กับต้นทุนการคาดการณ์ผิดพลาดของคุณนั่นคือข้อผิดพลาดชนิดใดที่เจ็บปวดที่สุด หากไม่มีการดูความหมายที่แท้จริงของข้อผิดพลาดการคาดการณ์การอภิปรายเกี่ยวกับ "เกณฑ์ที่ดีกว่า" นั้นไม่มีความหมาย
การวัดความแม่นยำในการคาดการณ์เป็นหัวข้อใหญ่ในชุมชนการคาดการณ์เมื่อหลายปีก่อนและพวกเขายังคงปรากฏขึ้นมาในขณะนี้ บทความที่ดีมากที่ควรอ่านคือ Hyndman & Koehler "ดูที่การวัดความแม่นยำในการคาดการณ์อีกครั้ง" (2006)
ในที่สุดทางเลือกหนึ่งคือการคำนวณความหนาแน่นของการทำนายเต็มรูปแบบและประเมินการใช้ที่เหมาะสมเหล่านี้ให้คะแนนกฎ