ความเข้าใจในแนวคิดเกี่ยวกับความคลาดเคลื่อนของรูตเฉลี่ยและความเบี่ยงเบนเฉลี่ยของอคติ


13

ฉันต้องการทำความเข้าใจแนวคิดเกี่ยวกับ Root Mean Squared Error (RMSE) และ Mean Bias Deviation (MBD) จากการคำนวณมาตรการเหล่านี้สำหรับการเปรียบเทียบข้อมูลของฉันเองฉันมักจะงงงวยที่จะพบว่า RMSE สูง (เช่น 100 กิโลกรัม) ในขณะที่ MBD ต่ำ (เช่นน้อยกว่า 1%)

โดยเฉพาะอย่างยิ่งฉันกำลังมองหาการอ้างอิง (ไม่ใช่ออนไลน์) ที่แสดงรายการและกล่าวถึงคณิตศาสตร์ของมาตรการเหล่านี้ วิธีใดที่ยอมรับกันโดยทั่วไปในการคำนวณการวัดทั้งสองนี้และฉันจะรายงานได้อย่างไรในรายงานบทความวารสาร

มันจะมีประโยชน์มากในบริบทของโพสต์นี้ที่จะมีชุดข้อมูล "ของเล่น" ที่สามารถใช้เพื่ออธิบายการคำนวณของทั้งสองมาตรการ

ตัวอย่างเช่นสมมติว่าฉันกำลังค้นหามวล (เป็นกิโลกรัม) ของ 200 วิดเจ็ตที่ผลิตโดยสายการประกอบ ฉันยังมีแบบจำลองทางคณิตศาสตร์ที่จะพยายามทำนายมวลของวิดเจ็ตเหล่านี้ โมเดลไม่จำเป็นต้องเป็นแบบประจักษ์พยานและสามารถใช้แบบจำลองได้ ฉันคำนวณ RMSE และ MBD ระหว่างการวัดจริงกับโมเดลโดยพบว่า RMSE คือ 100 กิโลกรัมและ MBD คือ 1% สิ่งนี้หมายความว่าอะไรเกี่ยวกับแนวคิดและฉันจะตีความผลลัพธ์นี้ได้อย่างไร

ตอนนี้สมมติว่าฉันพบจากผลลัพธ์ของการทดสอบนี้ว่า RMSE คือ 10 กิโลกรัมและ MBD คือ 80% สิ่งนี้หมายความว่าอย่างไรและฉันจะพูดอะไรเกี่ยวกับการทดสอบนี้ได้บ้าง

ความหมายของมาตรการเหล่านี้คืออะไรและทั้งสองของพวกเขา (นำมารวมกัน) หมายถึงอะไร ข้อมูลเพิ่มเติมอะไรที่ MBD ให้เมื่อพิจารณาด้วย RMSE


2
คุณดูไซต์ของเราหรือยังนิโคลัส? พิจารณาเริ่มต้นที่stats.stackexchange.com/a/17545จากนั้นสำรวจแท็กบางส่วนที่ฉันเพิ่มไว้ในคำถามของคุณ
whuber

@whuber: ขอบคุณ whuber! ฉันได้ดูเว็บไซต์แล้ว แต่สำหรับฉันฉันยังคงพบว่ามันค่อนข้างท้าทายที่จะเข้าใจสิ่งที่มีความหมายจริงๆในบริบทของการวิจัยของฉันเอง
นิโคลัส Kinar

คำตอบ:


21

ฉันคิดว่าแนวคิดเหล่านี้อธิบายได้ง่าย ดังนั้นฉันอยากจะอธิบายที่นี่ ฉันแน่ใจว่าหนังสือสถิติเบื้องต้นหลายเล่มครอบคลุมเรื่องนี้รวมถึงหนังสือของฉัน "สิ่งจำเป็นสำหรับชีวสถิติสำหรับแพทย์พยาบาลและแพทย์"

คิดว่าเป้าหมายกับบูลส์ - อายอยู่ตรงกลาง ความคลาดเคลื่อนกำลังสองเฉลี่ยหมายถึงระยะทางยกกำลังสองเฉลี่ยจากลูกศรที่ยิงเข้าที่เป้าหมายและศูนย์กลาง ทีนี้ถ้าลูกธนูของคุณกระจายกันอยู่ตรงกลางแล้วปืนก็จะไม่มีอคติการเล็งและความคลาดเคลื่อนกำลังสองเฉลี่ยก็เท่ากับความแปรปรวน

แต่โดยทั่วไปลูกศรสามารถกระจายไปรอบ ๆ จุดหนึ่งห่างจากเป้าหมาย ระยะทางยกกำลังสองเฉลี่ยของลูกศรจากศูนย์กลางของลูกศรคือความแปรปรวน จุดศูนย์กลางนี้อาจถูกมองว่าเป็นจุดมุ่งหมายของมือปืน ระยะทางจากจุดศูนย์กลางของนักกีฬาหรือจุดเล็งถึงศูนย์กลางของเป้าหมายคือค่าสัมบูรณ์ของอคติ

นึกถึงสามเหลี่ยมมุมฉากที่จตุรัสของด้านตรงข้ามมุมฉากคือผลรวมของ sqaures ของทั้งสองด้าน ระยะห่างกำลังสองจากลูกศรถึงเป้าหมายคือกำลังสองของระยะทางจากลูกศรไปยังจุดเล็งและกำลังสองของระยะทางระหว่างจุดศูนย์กลางของเป้าหมายและจุดมุ่งหมาย การหาค่าเฉลี่ยระยะทางสแควร์ทั้งหมดเหล่านี้ให้ค่าคลาดเคลื่อนกำลังสองเฉลี่ยเป็นผลรวมของอคติกำลังสองและความแปรปรวน


ขอขอบคุณ; นี่เป็นที่ชื่นชมอย่างมาก ฉันยังคงพบว่ามันท้าทายเล็กน้อยที่จะเข้าใจความแตกต่างระหว่าง RMSE และ MBD เมื่อฉันเข้าใจแล้ว RMSE จะคำนวณปริมาณของแบบจำลองใกล้เคียงกับข้อมูลการทดลอง แต่บทบาทของ MBD คืออะไร บางทีความเข้าใจผิดของฉันอาจเกี่ยวข้องกับคำศัพท์
นิโคลัส Kinar

1
ค่าเบี่ยงเบนอคติเฉลี่ยขณะที่คุณเรียกมันว่าเป็นคำอคติที่ฉันอธิบาย มันวัดระยะห่างของจุดมุ่งหมายที่อยู่ห่างจากเป้าหมาย อคติมีส่วนทำให้การยิงผิดพลาด
Michael R. Chernick

ขอบคุณอีกครั้งไมเคิล ดังนั้น RMSE ที่สูงและ MBD ต่ำหมายความว่ามันเป็นแบบจำลองที่ดี?
นิโคลัส Kinar

ไม่มี RMSE สูงและ MBD ต่ำเพียงแค่บอกว่าตัวแบบนั้นแย่เพราะความแปรปรวนขนาดใหญ่แทนที่จะมีอคติขนาดใหญ่ RMSE คือหมายเลขที่ตัดสินว่าแบบจำลองนั้นดีเพียงใด
Michael R. Chernick

1
@badyalina: เป็นข้อมูลอิสระในลักษณะเดียวกับที่ขึ้น / ลงและซ้าย / ขวาเป็นอิสระ คำถามของคุณเหมือนกับถามว่า"ถ้าจุดอยู่กึ่งกลางแนวตั้งและไปทางซ้ายจะอยู่ตรงกลางหรือไม่" หรือ"หากจุดสูงขึ้น แต่อยู่ตรงกลางในแนวนอนมันอยู่ตรงกลางหรือไม่"
naught101

1

RMSE เป็นวิธีการวัดแบบจำลองการทำนายของเราที่ดีกว่าข้อมูลจริง RMSE ที่เล็กลงเป็นวิธีที่ดีกว่าของแบบจำลองพฤติกรรมนั่นคือถ้าเราทดสอบในชุดข้อมูลใหม่ (ไม่ใช่ในชุดการฝึกอบรมของเรา) แต่หลังจากนั้น RMSE 0.37 ในช่วง 0 ถึง 1 บัญชีสำหรับข้อผิดพลาดจำนวนมากเมื่อเทียบกับการมี RMSE 0.01 เป็นแบบจำลองที่ดีกว่า BIAS สำหรับการประเมินค่าสูงไปหรือต่ำไป


คุณช่วยอธิบายรายละเอียดเพิ่มเติมและตัวอย่างผลงานได้ไหม OP กำลังมองหาคำอธิบายที่เข้าใจง่ายเกี่ยวกับความหมายของ RMSE ของ, พูด, 100, กับปัญหาการประมาณของเขา
ซีอาน

นี่ดูเหมือนจะไม่ได้ใช้สัญชาตญาณมากนัก คุณอธิบายเพิ่มเติมได้ไหม
Glen_b -Reinstate Monica

0

เท่าที่ฉันสามารถเข้าใจได้ RMSE ให้ค่าที่ถูกต้องมากกว่าของข้อผิดพลาดระหว่างแบบจำลองและแบบสังเกตอย่างไรก็ตาม BIAS นอกเหนือจากการให้ค่าความผิดพลาด (ความแม่นยำน้อยกว่า RMSE) ก็สามารถกำหนดได้ว่าแบบจำลองนั้นเป็นอย่างไร อคติเชิงบวกหรืออคติเชิงลบหากแบบจำลองประเมินค่าต่ำไปหรือประเมินค่าสูงไปกว่าค่าที่สังเกตได้


ไม่คุณสามารถคิดว่า RMSE เป็น "ความแม่นยำ" ของแบบจำลอง - เช่นมีการแพร่กระจายมากเพียงใดในข้อผิดพลาดของการทำนาย (หมายเหตุ: ความแม่นยำคือค่าผกผันของความแปรปรวน - ความแปรปรวนสูง = ความแม่นยำต่ำ) และคุณสามารถคิดว่าอคตินั้นเป็นข้อผิดพลาดที่เป็นระบบในตัวแบบ - เช่นค่าเฉลี่ยของความผิดพลาดทั้งหมด "ความถูกต้อง" ของงานนั้นเป็นการผสมผสานที่คลุมเครือของทั้งสองสิ่งนี้และทำให้เกิดความสับสนอย่างมาก
naught101
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.