ข้อผิดพลาดมาตรฐานที่เหลือคืออะไร


35

เมื่อรันโมเดลการถดถอยหลายแบบใน R เอาต์พุตหนึ่งในนั้นคือข้อผิดพลาดมาตรฐานที่เหลืออยู่ที่ 0.0589 กับองศาอิสระ 95,161 องศา ฉันรู้ว่าอิสรภาพ 95,161 ดีกรีนั้นมาจากความแตกต่างระหว่างจำนวนการสังเกตในตัวอย่างของฉันกับจำนวนตัวแปรในแบบจำลองของฉัน ข้อผิดพลาดมาตรฐานที่เหลือคืออะไร



คำถามด่วน: "ข้อผิดพลาดมาตรฐานส่วนที่เหลือ" เหมือนกับ "ส่วนเบี่ยงเบนมาตรฐานส่วนที่เหลือ" หรือไม่? Gelman and Hill (p.41, 2007) ดูเหมือนจะใช้แทนกันได้
JetLag

คำตอบ:


26

แบบจำลองการถดถอยแบบประกอบใช้พารามิเตอร์เพื่อสร้างการคาดคะเนจุดซึ่งเป็นวิธีการตอบสนองที่สังเกตได้หากคุณต้องทำซ้ำการศึกษาด้วยค่าเดียวกันกับจำนวนอนันต์จำนวนครั้ง (และเมื่อแบบจำลองเชิงเส้นเป็นจริง) ความแตกต่างระหว่างค่าที่คาดการณ์เหล่านี้และค่าที่ใช้เพื่อให้พอดีกับแบบจำลองนั้นเรียกว่า "ส่วนที่เหลือ" ซึ่งเมื่อทำการจำลองกระบวนการรวบรวมข้อมูลมีคุณสมบัติของตัวแปรสุ่มที่มีค่า 0X

จากนั้นจะใช้ค่าที่เหลือที่สังเกตได้เพื่อประเมินความแปรปรวนในค่าเหล่านี้ในภายหลังและเพื่อประเมินการกระจายตัวตัวอย่างของพารามิเตอร์ เมื่อข้อผิดพลาดมาตรฐานที่ตกค้างเป็น 0 อย่างแน่นอนโมเดลจะพอดีกับข้อมูลอย่างสมบูรณ์ (น่าจะเกิดจากการ overfitting) หากข้อผิดพลาดมาตรฐานส่วนที่เหลือไม่สามารถแสดงให้เห็นถึงความแตกต่างอย่างมีนัยสำคัญจากความแปรปรวนในการตอบสนองแบบไม่มีเงื่อนไขนั้นมีหลักฐานเพียงเล็กน้อยที่ชี้ให้เห็นว่าแบบจำลองเชิงเส้นมีความสามารถในการทำนายใด ๆ


3
สิ่งนี้อาจได้รับคำตอบมาก่อน ดูว่าคำถามนี้ให้คำตอบที่คุณต้องการ [การแปลเอาต์พุต R's lm ()] [1] [1]: stats.stackexchange.com/questions/5135/…
doug.numbers

26

สมมติว่าเรามีตาราง ANOVA ต่อไปนี้ (ดัดแปลงจากexample(aov)คำสั่งของ R ):

          Df Sum Sq Mean Sq F value Pr(>F)
Model      1   37.0   37.00   0.483  0.525
Residuals  4  306.3   76.57               

หากคุณหารผลรวมของกำลังสองจากแหล่งที่มาของการเปลี่ยนแปลงใด ๆ (แบบจำลองหรือส่วนที่เหลือ) ตามระดับความอิสระนั้น ๆ คุณจะได้ค่ากำลังสองเฉลี่ย โดยเฉพาะอย่างยิ่งสำหรับสารตกค้าง:

306.34=76.57576.57

ดังนั้น 76.57 คือค่าเฉลี่ยกำลังสองของส่วนที่เหลือนั่นคือจำนวนของรูปแบบที่เหลือ (หลังจากใช้ตัวแบบ) กับตัวแปรตอบกลับของคุณ

76.57


1
ฉันลงคะแนนคำตอบจาก @AdamO เพราะในฐานะคนที่ใช้การถดถอยโดยตรงบ่อยที่สุดคำตอบนั้นตรงไปตรงมาที่สุดสำหรับฉัน อย่างไรก็ตามฉันขอขอบคุณคำตอบนี้เพราะมันแสดงให้เห็นถึงความสัมพันธ์ระหว่างสัญกรณ์ / แนวคิด / ระเบียบวิธีระหว่าง ANOVA และการถดถอยเชิงเส้น
svannoy

12

Y=β0+β1X+ε
εX

β0β1εε

RSE ได้รับการอธิบายอย่างชัดเจนใน "ความรู้เบื้องต้นเกี่ยวกับสถิติ"


2
εRSE=RSS(n-2)

1
สำหรับทุกคนที่อ่าน epub ของ ISL คุณสามารถค้นหา "หน้า 66" ด้วย ctrl-f "ข้อผิดพลาดมาตรฐานส่วนที่เหลือ" (ไฟล์ Epub ไม่มีหมายเลขหน้าจริง)
user2426679
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.