เหตุผลที่ฉันถามนี้เพราะดูเหมือนว่าเศษที่เหลือเป็นนักเรียนภายในดูเหมือนจะมีรูปแบบเดียวกับของเหลือใช้โดยประมาณ มันจะดีถ้ามีคนเสนอคำอธิบาย
เหตุผลที่ฉันถามนี้เพราะดูเหมือนว่าเศษที่เหลือเป็นนักเรียนภายในดูเหมือนจะมีรูปแบบเดียวกับของเหลือใช้โดยประมาณ มันจะดีถ้ามีคนเสนอคำอธิบาย
คำตอบ:
สมมติว่ารูปแบบการถดถอยพร้อมเมทริกซ์การออกแบบ ( คอลัมน์ตามด้วยตัวทำนายของคุณ) การคาดเดา (ที่\ BF {H}เป็น "หมวกแมทริกซ์") และที่เหลือ\ BF {E} = \ BF {y} - \ hat {\ BF {y}} ตัวแบบการถดถอยสันนิษฐานว่าข้อผิดพลาดที่แท้จริง\ bf {\ epsilon}มีความแปรปรวนเดียวกัน (homoskedasticity):X 1 Y = X ( X ' X ) - 1 X ' Y = H Y H E = Y - Y ε
เมทริกซ์ความแปรปรวนของเหลือคือ{H}) นี่หมายความว่าวัตถุดิบดิบมีความแตกต่าง - เส้นทแยงมุมของเมทริกซ์}) องค์ประกอบเส้นทแยงมุมของเป็นหมวกค่า{}e i σ 2 ( 1 - h ฉันฉัน ) σ 2 ( I - H ) H h ฉันฉัน
เหลือมาตรฐานอย่างแท้จริงกับความแปรปรวน 1 ตลอดจึงii) ปัญหาคือไม่ทราบความแปรปรวนของความผิดพลาดและภายใน / ภายนอกเศษเรียนผลจากการเลือกโดยเฉพาะสำหรับการประเมินซิก}σE/( σ √ σ
เนื่องจากเหลือดิบที่คาดว่าจะ heteroskedastic แม้ว่ามี homoskedastic ที่เหลือดิบในทางทฤษฎีที่เหมาะสมน้อยดีที่จะวินิจฉัยปัญหาเกี่ยวกับสมมติฐาน homoskedasticity กว่ามาตรฐานหรือเหลือ studentized
คุณได้ทำการทดสอบข้อมูลประเภทใด เมื่อสมมติฐานทั้งหมดถือ (หรือเข้ามาใกล้) จากนั้นฉันจะไม่คาดหวังความแตกต่างระหว่างส่วนที่เหลือและการเรียนรู้ข้อดีที่สำคัญคือเมื่อมีจุดที่มีอิทธิพลอย่างมาก พิจารณาข้อมูลนี้ (จำลอง) ที่มีแนวโน้มเป็นเส้นตรงในเชิงบวกและค่าที่มีอิทธิพลสูง:
นี่คือพล็อตของค่าติดตั้งกับส่วนที่เหลือดิบ:
ขอให้สังเกตว่ามูลค่าของส่วนที่เหลือของจุดที่มีอิทธิพลของเรานั้นอยู่ใกล้กับ 0 มากกว่าค่าต่ำสุดและค่าตกค้างสูงสุดจากจุดที่เหลือ (มันไม่ได้อยู่ใน 3 ส่วนที่เหลือดิบมากที่สุด)
ตอนนี้ที่นี่คือพล็อตที่มีของตกค้างที่ได้มาตรฐาน (ภายในนักเรียน):
ในโครงเรื่องนี้ส่วนที่เหลือที่เป็นมาตรฐานนั้นมีความโดดเด่นเนื่องจากมีการคำนึงถึงอิทธิพลของมัน
ในตัวอย่างง่ายๆนี้มันง่ายที่จะดูว่าเกิดอะไรขึ้น แต่ถ้าเรามีตัวแปรมากกว่า 1และจุดที่มีอิทธิพลมาก แต่ไม่ผิดปกติในแปลงสองมิติ มันจะไม่ชัดเจนจากแปลงของเศษซากดิบ แต่เศษเหลือของนักเรียนจะแสดงให้เห็นว่าส่วนที่เหลือนั้นสุดขั้วมากขึ้น