ความแตกต่างระหว่างความแปรปรวนกับความคลาดเคลื่อนกำลังสองเฉลี่ยคืออะไร


27

ฉันประหลาดใจที่สิ่งนี้ไม่ได้ถูกถามมาก่อน แต่ฉันไม่สามารถหาคำถามเกี่ยวกับสถิติได้

นี่คือสูตรในการคำนวณความแปรปรวนของตัวอย่างที่กระจายแบบปกติ:

(XX¯)2n1

นี่คือสูตรในการคำนวณความคลาดเคลื่อนเฉลี่ยกำลังสองของการสังเกตในการถดถอยเชิงเส้นอย่างง่าย:

(yiy^i)2n2

สูตรสองสูตรนี้แตกต่างกันอย่างไร? ความแตกต่างเดียวที่ฉันสามารถเห็นคือ MSE ใช้n-2ดังนั้นถ้านั่นคือความแตกต่างเท่านั้นทำไมไม่เรียกพวกเขาว่าเป็นทั้งความแปรปรวน แต่ด้วยระดับความอิสระที่แตกต่างกัน?n2


มันเกี่ยวกับหน้าวิกิพีเดียที่นี่ที่ไม่ชัดเจนคืออะไร?
TrynnaDoStat

3
ความแปรปรวนคือค่าเฉลี่ยของการเบี่ยงเบนกำลังสองของการสังเกตจากค่าเฉลี่ย ในทางตรงกันข้าม MSE คือค่าเฉลี่ยของการเบี่ยงเบนกำลังสองของการทำนายจากค่าจริง
random_guy

3
ทั้ง "ความแปรปรวน" และ "หมายถึงข้อผิดพลาดกำลังสอง" มีหลายสูตรและแอปพลิเคชันที่แตกต่างกัน เพื่อชี้แจงคำถามของคุณคุณสามารถ (ก) อธิบายประเภทของข้อมูลที่คุณใช้กับแนวคิดเหล่านี้และ (b) ให้สูตรสำหรับพวกเขาหรือไม่ (เป็นไปได้ว่าในการทำเช่นนั้นคุณจะค้นพบคำตอบสำหรับคำถามของคุณเช่นกัน)
whuber

6
มีสูตรทั่วไปมากขึ้นซึ่งทั้งสองกรณีเป็นพิเศษ:โดยที่คือจำนวนพารามิเตอร์ที่ได้รับโดยประมาณพี Yi(yiy^i)2nppy^
Glen_b -Reinstate Monica

@Glen_b โปรดช่วยอ้างอิงสำหรับข้อมูลเพิ่มเติมเกี่ยวกับสูตรทั่วไปนี้ได้ไหม?
trianta2

คำตอบ:


28

ข้อผิดพลาดกำลังสองเฉลี่ยที่คุณเขียนไว้สำหรับ OLS กำลังซ่อนบางสิ่ง:

in(yiy^i)2n2=in[yi(β^0+β^xxi)]2n2

ขอให้สังเกตว่าผลรวมเศษมากกว่าฟังก์ชั่นของทั้งสองและดังนั้นคุณจะสูญเสียระดับของเสรีภาพสำหรับแต่ละตัวแปรจึงn-2ในสูตรสำหรับความแปรปรวนตัวอย่างตัวเศษเป็นฟังก์ชันของตัวแปรเดี่ยวดังนั้นคุณจึงสูญเสียอิสรภาพเพียงหนึ่งระดับในตัวส่วนyxn2

อย่างไรก็ตามคุณกำลังติดตามว่ามีปริมาณใกล้เคียงกับแนวคิด ความแปรปรวนตัวอย่างวัดการแพร่กระจายของข้อมูลรอบค่าเฉลี่ยตัวอย่าง (ในหน่วยกำลังสอง) ในขณะที่ MSE วัดการแพร่กระจายในแนวตั้งของข้อมูลรอบ ๆ เส้นถดถอยตัวอย่าง (ในหน่วยแนวตั้งกำลังสอง)


@amoeba เฮ้! ขอบคุณสำหรับความสนใจ มีคู่มือสไตล์ CV อย่างเป็นทางการที่แจ้งให้แก้ไขนี้หรือไม่ ถ้าฉันต้องการเรียนรู้มัน ถ้าไม่เช่นนั้น Glen_b เคยตำหนิฉันอย่างถูกต้องว่าเป็นอาณานิคมด้วยการตั้งค่าสไตล์ส่วนตัวของฉันและแก้ไขให้กับผู้อื่น Qs และ As คุณคิดอย่างไร? (และฉันขอสิ่งนี้ในน้ำเสียงของฉัน: ฉันคิดว่าการแก้ไขของคุณจะเพิ่มบางสิ่งเพียงแค่ต้องการที่จะเข้าใจค่าการแก้ไขของเราดีขึ้น)
Alexis

1
ฉันไม่คิดว่าจะมีคู่มือสไตล์ CV อย่างเป็นทางการที่ทำคำแนะนำนี้ แต่ใน LaTeX มีสูตรแบบอินไลน์ (ทำเครื่องหมายด้วยเครื่องหมายดอลลาร์หนึ่ง) ที่แสดงโดยตรงในบล็อกข้อความและสูตรที่แสดง (ทำเครื่องหมายด้วยเครื่องหมายดอลลาร์สองรายการ) ที่แสดงผลในบรรทัดแยกต่างหาก สูตรที่แสดงใช้เค้าโครงที่แตกต่างกัน สูตรของคุณเดิมอยู่ในบรรทัดที่แยกต่างหาก ฉันไม่คิดว่ามันสมเหตุสมผล อย่างไรก็ตามคุณถูกต้องเกี่ยวกับความชอบส่วนตัวดังนั้นอย่าลังเลที่จะย้อนกลับมาขอโทษ เหตุผลที่ฉันแก้ไขคือฉันแก้ไขข้อผิดพลาดในคำถามต่อไป
อะมีบากล่าวว่า Reinstate Monica

หากไม่มีการสกัดกั้นเทอมในปัญหาการถดถอยดังนั้นองศาความอิสระของ MSE เท่ากับเช่นในสูตรความแปรปรวนแทน n - 1 n - 2β0n1n2
พัฒนาที่

1

ในสูตรความแปรปรวนตัวอย่างหมายถึงค่าประมาณประชากร ค่าเฉลี่ยตัวอย่างถูกคำนวณสำหรับตัวอย่างที่กำหนดด้วยจุดข้อมูลรู้ใบเฉลี่ยตัวอย่างเรามีเพียงจุดข้อมูลที่เป็นอิสระเป็น THจุดข้อมูลจะถูก จำกัด โดยค่าเฉลี่ยของกลุ่มตัวอย่างดังนั้น ( ) องศาอิสระ (DOF) ในส่วนในสูตรที่แปรปรวนnn1nn - 1n1

ในการรับค่าประมาณของ y ( ) ในสูตร MSE เราต้องประเมินทั้ง (เช่นการสกัดกั้น) และ (เช่นความชัน) ดังนั้นเราจึงสูญเสีย 2 อานนท์และนั่นคือเหตุผลสำหรับ ( ) ในตัวส่วนในสูตร MSE=β0+β1×xβ0β1n2

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.