หมายถึงข้อผิดพลาดสัมบูรณ์หรือรูทหมายความว่าข้อผิดพลาดกำลังสอง?


58

เหตุใดจึงต้องใช้ Root Mean Squared Error (RMSE) แทนที่จะเป็น Mean Absolute Error (MAE)?

สวัสดี

ฉันได้ตรวจสอบข้อผิดพลาดที่สร้างขึ้นในการคำนวณ - ในขั้นต้นฉันคำนวณข้อผิดพลาดเป็นข้อผิดพลาดรูตค่าเฉลี่ย Normalized Root

เมื่อมองดูใกล้ ๆ ฉันจะเห็นผลกระทบของการยกกำลังข้อผิดพลาดนั้นให้น้ำหนักมากกว่าข้อผิดพลาดที่ใหญ่กว่าตัวที่เล็กกว่า นี่ค่อนข้างชัดเจนในการหวนกลับ

ดังนั้นคำถามของฉัน - ในกรณีที่รูทค่าเฉลี่ยของข้อผิดพลาดกำลังสองเป็นข้อผิดพลาดที่เหมาะสมกว่าการวัดค่าความผิดพลาดแบบสัมบูรณ์ หลังดูเหมาะสมกว่าสำหรับฉันหรือฉันขาดอะไรไป?

เพื่อแสดงสิ่งนี้ฉันได้แนบตัวอย่างด้านล่าง:

  • พล็อตกระจายกระจายแสดงตัวแปรสองตัวที่มีความสัมพันธ์ที่ดี

  • ฮิสโทแกรมสองแผนภูมิทางด้านขวาข้อผิดพลาดระหว่าง Y (สังเกต) และ Y (ทำนาย) โดยใช้ RMSE ปกติ (บนสุด) และแม่ (ล่าง)

ป้อนคำอธิบายรูปภาพที่นี่

ไม่มีค่าผิดปกติที่สำคัญในข้อมูลนี้และ MAE ให้ข้อผิดพลาดต่ำกว่า RMSE มีเหตุผลอื่นใดนอกเหนือจากแม่ที่เป็นที่นิยมกว่าสำหรับการใช้ข้อผิดพลาดหนึ่งวัดเหนืออื่น ๆ ?


9
เนื่องจาก RMSE และแม่เป็นข้อผิดพลาดสองแบบที่แตกต่างกันการเปรียบเทียบเชิงตัวเลขระหว่างพวกเขา (ซึ่งเกี่ยวข้องกับการยืนยันว่าแม่เป็น "ต่ำ" กว่า RMSE) จึงไม่มีความหมาย บรรทัดที่จะต้องได้รับการพอดีตามที่เกณฑ์: ว่าเกณฑ์สิ่งที่เป็นจะต้องมีมาตรการที่เกี่ยวข้องของข้อผิดพลาด
whuber

บรรทัดถูกติดตั้งโดยใช้กำลังสองน้อยที่สุด - แต่รูปเป็นเพียงตัวอย่างเพื่อแสดงความแตกต่างในข้อผิดพลาดที่วัดได้ ปัญหาที่แท้จริงของฉันคือการใช้เครื่องมือเพิ่มประสิทธิภาพเพื่อแก้ไขพารามิเตอร์ฟังก์ชันสี่ตัวเพื่อวัดข้อผิดพลาดที่ลดลงบางส่วนคือ Mae หรือ RMSE
user1665220

ขอบคุณสำหรับการชี้แจง แต่คุณสนใจข้อผิดพลาดอะไร ข้อผิดพลาดในการพอดีหรือข้อผิดพลาดในการประมาณการพารามิเตอร์ ?
whuber

1
ข้อผิดพลาดในการฟิต ฉันมีตัวอย่างห้องปฏิบัติการบางอย่างที่ให้ y ซึ่งฉันต้องการทำนายการใช้ฟังก์ชั่น ฉันปรับฟังก์ชันให้เหมาะสมสำหรับ 4 เลขชี้กำลังโดยลดข้อผิดพลาดให้พอดีกับข้อมูลที่สังเกตและทำนาย
user1665220

ใน RMSE เราจะพิจารณารูทของจำนวนรายการ (n) นั่นคือรากของ MSE หารด้วยรากของ n รูตของ MSE นั้นใช้ได้ แต่แทนที่จะหารด้วย n จะถูกหารด้วยรูทของ n เพื่อรับ RMSE ฉันรู้สึกว่ามันจะเป็นนโยบาย ความเป็นจริงจะเป็น (Root of MSE) / n ด้วยวิธีนี้แม่จะดีกว่า

คำตอบ:


57

ขึ้นอยู่กับฟังก์ชั่นการสูญเสียของคุณ ในหลาย ๆ สถานการณ์มันเป็นเรื่องสมเหตุสมผลที่จะให้น้ำหนักกับคะแนนมากกว่าห่างจากค่าเฉลี่ย - นั่นคือการปิดด้วย 10 นั้นมากกว่าสองเท่าที่แย่กว่าการถูกปิดโดย 5 ในกรณีเช่นนี้ RMSE เป็นการวัดข้อผิดพลาดที่เหมาะสมกว่า

ถ้าการออกไปสิบครั้งนั้นแย่กว่าการตี 5 ครั้งสองครั้งแล้วล่ะก็แม่ก็เหมาะสมกว่า

ไม่ว่าในกรณีใดมันไม่สมเหตุสมผลที่จะเปรียบเทียบ RMSE และแม่กับแต่ละอื่น ๆ เช่นคุณในประโยคที่สองถึงครั้งสุดท้ายของคุณ ("แม่ให้ข้อผิดพลาดต่ำกว่า RMSE") Mae จะไม่สูงกว่า RMSE เนื่องจากวิธีการคำนวณ พวกเขามีเหตุผลเมื่อเปรียบเทียบกับข้อผิดพลาดแบบเดียวกันเท่านั้น: คุณสามารถเปรียบเทียบ RMSE สำหรับวิธีที่ 1 ถึง RMSE สำหรับวิธีที่ 2 หรือแม่สำหรับวิธีที่ 1 กับแม่สำหรับวิธีที่ 2 แต่คุณไม่สามารถพูดได้ว่าแม่ดีกว่า RMSE สำหรับวิธีการ 1 เพราะมันเล็กกว่า


ฉันเข้าใจว่าแม่จะไม่สูงไปกว่า RMSE ฉันใช้ทั้งการประมาณการข้อผิดพลาดและมองหาความแตกต่างระหว่างค่าเพื่อบอกถึงผลกระทบของค่าผิดปกติ คือเมื่อพวกเขาสนิทกันมากเมื่อพวกเขาอยู่ห่างไกลกันฉันก็ตรวจสอบเพื่อดูว่าเกิดอะไรขึ้น ท้ายที่สุดฉันต้องการทำนายพารามิเตอร์ที่เหมาะสมกับข้อมูลมากที่สุดและเช่นข้อผิดพลาด 9% เสียงดีกว่า 12% - ฉันแค่อยากให้แน่ใจว่าฉันเลือกสิ่งที่ถูกต้องด้วยเหตุผลที่เหมาะสม ไชโยสำหรับคำแนะนำของคุณ
user1665220

ความแตกต่างที่สำคัญระหว่าง RMSE (ดังนั้น MSE) และ MAE ไม่ได้เกี่ยวกับความผิดพลาดของน้ำหนัก คุณสามารถใช้ฟังก์ชันน้ำหนักได้ถ้าต้องการ ข้อแตกต่างที่สำคัญคือ MSE เกี่ยวข้องกับ L2 Space (แม่ไม่มีสิ่งนั้น) ตัวอย่างเช่น MSE สามารถวัดปริมาณพลังงานที่จำเป็นสำหรับการควบคุมวงปิดเมื่อ E เป็นสัญญาณตอบรับ (จำค่าเฉลี่ยสแควร์ของสัญญาณข้อผิดพลาดในกรณีนี้เป็นสัดส่วนกับพลังงานของมัน) นอกจากนี้คณิตศาสตร์และอัลกอริธึมมากมายเช่น Marquardt-Levenberg ทำงานในพื้นที่นี้ พูดง่ายๆก็คือพวกเขาใช้ MSE เป็นฟังก์ชันวัตถุประสงค์
eulerleibniz

17

นี่คือสถานการณ์อื่นเมื่อคุณต้องการใช้ (R) MSE แทนที่จะเป็น Mae: เมื่อการกระจายแบบมีเงื่อนไขของคุณเป็นแบบไม่สมมาตรและคุณต้องการความพอดีแบบไม่ลำเอียง (r) MSE จะลดลงโดยมีเงื่อนไขค่าเฉลี่ย , แม่โดยมีเงื่อนไขค่ามัธยฐาน ดังนั้นถ้าคุณย่อเล็กสุดให้พอดีจะอยู่ใกล้กับค่ามัธยฐานและลำเอียง

แน่นอนทั้งหมดนี้ขึ้นอยู่กับฟังก์ชันการสูญเสียของคุณ

ปัญหาเดียวกันเกิดขึ้นหากคุณกำลังใช้แม่หรือ (R) MSE ในการประเมินการคาดการณ์หรือคาดการณ์ ตัวอย่างเช่นข้อมูลการขายในปริมาณต่ำมักมีการแจกแจงแบบไม่สมมาตร หากคุณเพิ่มประสิทธิภาพของแม่คุณอาจแปลกใจที่พบว่าการคาดการณ์ที่เหมาะสมที่สุดสำหรับแม่คือการคาดการณ์ที่ไม่มีศูนย์

นี่คือการนำเสนอเล็กน้อยที่ครอบคลุมสิ่งนี้และนี่เป็นคำวิจารณ์ที่ได้รับเชิญเมื่อเร็ว ๆ นี้เกี่ยวกับการแข่งขันการคาดการณ์ M4 ซึ่งฉันอธิบายผลกระทบนี้


+1 ความคิดในการเปรียบเทียบการแจกแจงนั้นยอดเยี่ยม แต่ ... จะไม่มีเมตริกเช่นเดียวกับที่คุณนำเสนอล้มเหลวอย่างน่าสังเวชในบางสิ่งบางอย่างN = 1e3; set.seed(1); y = rpois(N, lambda=1); yhat = c(y[2:N],0)ใช่ไหม ความหนาแน่นที่คาดการณ์ได้ "ความแตกต่าง" จะน้อยที่สุด แต่ความจริงyhatนั้นจะไร้ประโยชน์ จริงอยู่นี่เป็นกรณีที่รุนแรงมาก (ฉันอาจจะขาดอะไรบางอย่างที่ชัดเจนขอโทษสำหรับสิ่งนั้นล่วงหน้า - ฉันไม่สามารถเข้าถึงเอกสารเพียงแค่การนำเสนอ)
usεr11852พูดว่า Reinstate Monic

@ usεr11852: ใช่ลำดับการคาดคะเนของคุณจะไร้ประโยชน์โดยเฉพาะอย่างยิ่งแย่กว่าการคาดการณ์แบบแบน (ซึ่งทั้งค่าเฉลี่ยและค่ามัธยฐานดังนั้นจึงเหมาะสำหรับทั้งแม่และ MSE) . การพยากรณ์ความหนาแน่นไม่ได้เป็นเพียงการเรียงลำดับของการพยากรณ์จุด! มันเป็นคำทำนายความหนาแน่นสมบูรณ์สำหรับจุดในแต่ละครั้งในอนาคต ดังนั้นเราจะทำนาย Pois (1) เป็นครั้งแรกสำหรับจุดที่สองสำหรับที่สามเป็นต้นy^=1
S. Kolassa - Reinstate Monica

ขอบคุณมากสำหรับคำอธิบาย ฉันสามารถแสดงแนวคิดการนำเสนอได้ดีขึ้นในขณะนี้ (อืม ... ฉันต้อง
หยิบ

@ usεr11852: อย่าลังเลที่จะติดต่อฉันทางอีเมล ( ค้นหาที่อยู่ที่นี่ ) - หากจดหมายของคุณไม่ได้อยู่ในตัวกรองสแปมของฉันฉันจะส่งเอกสารนั้นให้คุณอย่างมีความสุข
S. Kolassa - Reinstate Monica

@ usεr11852ฉันหลงทางคุณหลังจาก "like N =" นั่นคืออะไร?
sak

5

ป้อนคำอธิบายรูปภาพที่นี่

RMSE เป็นวิธีที่เป็นธรรมชาติมากขึ้นในการอธิบายการสูญเสียในระยะทางแบบยุคลิด ดังนั้นหากคุณวาดกราฟในรูปแบบ 3 มิติการสูญเสียจะอยู่ในรูปทรงกรวยดังที่คุณเห็นด้านบนเป็นสีเขียว สิ่งนี้ยังใช้กับมิติที่สูงขึ้นแม้ว่าจะมองเห็นได้ยากขึ้น

แม่ถือได้ว่าเป็นระยะทางในเมือง มันไม่ใช่วิธีการวัดความสูญเสียที่แท้จริงตามที่คุณเห็นในกราฟเป็นสีน้ำเงิน

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.