ความสัมพันธ์ระหว่างและคือ:ε^ε
ε^= ( I- ช) ε
ที่ , เมทริกซ์หมวกเป็น THX(XTX)- 1XT
ซึ่งจะบอกว่าเป็นการรวมกันเชิงเส้นของข้อผิดพลาดทั้งหมด แต่โดยทั่วไปแล้วน้ำหนักส่วนใหญ่จะอยู่ที่ thε^ii
นี่คือตัวอย่างการใช้cars
ชุดข้อมูลในอาร์พิจารณาจุดที่ทำเครื่องหมายเป็นสีม่วง:
โทร Let 's มันชี้ให้ฉันส่วนที่เหลือโดยที่สำหรับข้อผิดพลาดอื่น ๆ อยู่ในพื้นที่ -0.02:iε^i≈0.98εi+∑j≠iwjεjwj
เราสามารถเขียนซ้ำว่า:
ε^i≈0.98εi+ηi
หรือโดยทั่วไป
ε^i=(1−hii)εi+ηi
ที่เป็น -th องค์ประกอบเส้นทแยงมุมของHในทำนองเดียวกัน 's ข้างต้นเป็น{IJ}hiiiHwjhij
หากข้อผิดพลาดคือ iidจากตัวอย่างนี้ผลรวมถ่วงน้ำหนักของข้อผิดพลาดอื่น ๆ เหล่านั้นจะมีค่าเบี่ยงเบนมาตรฐานที่สอดคล้องกับ 1 / 7th ผลกระทบของข้อผิดพลาดของการสังเกต th บนส่วนที่เหลือ .N(0,σ2)i
ในการถดถอยที่ดีนั้นเศษซากส่วนใหญ่สามารถถือว่าเป็นข้อผิดพลาดที่ไม่สามารถสังเกตเห็นได้ในระดับปานกลาง ในขณะที่เราพิจารณาคะแนนเพิ่มเติมจากจุดศูนย์กลางสิ่งต่าง ๆ ทำงานได้ค่อนข้างดี (ส่วนที่เหลือจะกลายเป็นน้ำหนักน้อยกว่าข้อผิดพลาดและน้ำหนักของข้อผิดพลาดอื่น ๆ จะน้อยลงด้วยซ้ำ)
ด้วยพารามิเตอร์จำนวนมากหรือด้วยที่ไม่ได้รับการกระจายอย่างดีเหลืออยู่อาจจะน้อยกว่าเช่นข้อผิดพลาด คุณอาจต้องการลองตัวอย่างX