ให้เป็นศูนย์กลางn × Pเมทริกซ์ทำนายและพิจารณาความคุ้มค่าจากการสลายตัวเอกพจน์X = U S V ⊤กับSเป็นเมทริกซ์ทแยงมุมกับองค์ประกอบในแนวทแยง sฉันXn×pX=USV⊤Ssi
ค่าติดตั้งของสี่เหลี่ยมน้อยสามัญ (OLS) ถดถอยจะได้รับจากY O L S = X β O L S = X ( X ⊤ X ) - 1 X ⊤ Y = U U ⊤ Y ค่าติดตั้งของการถดถอยสันจะได้รับจากY r ฉันวันที่กรัมE = X β r ฉันd กรัมE = X ( X ⊤ X
Y^O L S= X βO L S= X ( X⊤X )- 1X⊤y = U U⊤Y
ค่าติดตั้งของ PCA ถดถอย (PCR) กับ
kส่วนประกอบจะได้รับจาก
Y PCR=XPCβPCR=UY^r i d g e= X βr i d g e= X ( X⊤X +λ I )- 1X⊤y = Ud i a g { s2ผมs2ผม+ λ} คุณ⊤Y
kที่มี
kคนตามด้วยเลขศูนย์
Y^P C R= XP C AβP C R= Ud ฉันกรัม { 1 , ... , 1 , 0 , ... 0 } U⊤Y ,
k
จากที่นี่เราจะเห็นว่า:
ถ้าแล้วY R ฉันd กรัมE = Y O L Sλ = 0Y^r i d g e= y^O L S
λ > 0sผมs2ผม≈ λ
kλ = 0kλ = ∞
ซึ่งหมายความว่าการถดถอยของสันสามารถมองได้ว่าเป็น "เวอร์ชั่นต่อเนื่อง" ของ PCR
sผมX
การถดถอยบนสันมีแนวโน้มที่จะทำงานได้ดีขึ้นในทางปฏิบัติ (เช่นมีประสิทธิภาพที่ผ่านการตรวจสอบความถูกต้องสูงกว่า)
λ → 0Y^r i d g e→ y^O L Ssผม
การอ้างอิงที่ดีอย่างหนึ่งคือองค์ประกอบของการเรียนรู้เชิงสถิติส่วนที่ 3.4.1 "การถดถอยแนว"
ดูเพิ่มเติมที่เธรดนี้: การตีความการทำให้เป็นมาตรฐานของสันเขาในการถดถอยและโดยเฉพาะคำตอบของ @BrianBorchers