+1 ในภาพประกอบของ Glen_b และความคิดเห็นสถิติเกี่ยวกับตัวประมาณค่าริดจ์ ฉันแค่อยากจะเพิ่ม pov (พีชคณิตเชิงเส้น) ทางคณิตศาสตร์ล้วนๆในการถดถอยของแนวสันซึ่งตอบคำถามโอพีเอส 1) และ 2)
สิ่งแรกที่คือเมทริกซ์ semidefinite บวกสมมาตร -คูณเมทริกซ์ความแปรปรวนร่วมตัวอย่าง ดังนั้นมันจึงมีการย่อยสลายไอเก็นX′Xp×pn
X′X=VDV′,D=⎡⎣⎢⎢d1⋱dp⎤⎦⎥⎥,di≥0
ตอนนี้เนื่องจากเมทริกซ์ผกผันสอดคล้องกับการกลับกันของค่าลักษณะเฉพาะค่าประมาณ OLS ต้องการ (สังเกตว่า ) เห็นได้ชัดว่างานนี้เฉพาะในกรณีที่ค่าลักษณะเฉพาะทุกอย่างเคร่งครัดมากกว่าศูนย์0 สำหรับสิ่งนี้เป็นไปไม่ได้ สำหรับมันอยู่ในความจริงทั่วไป - นี่คือว่าเราเป็นมักจะมีความกังวลกับพหุ(X′X)−1=VD−1V′V′=V−1di>0p≫nn≫p
ในฐานะนักสถิติเรายังต้องการทราบว่าการรบกวนในข้อมูลเปลี่ยนแปลงการประมาณการ เป็นที่ชัดเจนว่าการเปลี่ยนแปลงเล็กน้อยในใด ๆนำไปสู่การเปลี่ยนแปลงครั้งใหญ่ในถ้ามีขนาดเล็กมากXdi1/didi
ดังนั้นการถดถอยของสันเขาคือการย้ายค่าลักษณะเฉพาะทั้งหมดให้ห่างจากศูนย์เช่น
X′X+λIp=VDV′+λIp=VDV′+λVV′=V(D+λIp)V′,
ซึ่งขณะนี้มีลักษณะเฉพาะ0 นี่คือเหตุผลที่เลือกพารามิเตอร์โทษบวกทำให้เมทริกซ์ผกผัน - แม้ในกรณี สำหรับการถดถอยของสันการแปรผันเล็กน้อยในข้อมูลนั้นไม่มีผลกระทบที่ไม่แน่นอนอีกต่อไปที่เกิดขึ้นกับเมทริกซ์ผกผัน
di+λ≥λ≥0p≫nX
เสถียรภาพเชิงตัวเลขเกี่ยวข้องกับการหดตัวเป็นศูนย์เนื่องจากทั้งคู่เป็นผลมาจากการเพิ่มค่าคงที่ที่เป็นบวกให้กับค่าลักษณะเฉพาะ: ทำให้มีเสถียรภาพมากขึ้นเนื่องจากการก่อกวนเล็ก ๆ ในไม่เปลี่ยนการผกผันมากเกินไป มันหดมันใกล้เคียงกับตั้งแต่ตอนนี้ระยะคูณซึ่งเป็นผู้ใกล้ชิดกับศูนย์กว่าการแก้ปัญหา OLS กับค่าลักษณะเฉพาะผกผันdX0V−1X′y1/(di+λ)1/d