การพิสูจน์ค่าสัมประสิทธิ์การหดตัวโดยใช้การถดถอยแบบสันผ่าน“ การสลายตัวของสเปกตรัม”


20

ฉันเข้าใจว่าการถดถอยของสันเขาลดค่าสัมประสิทธิ์ไปสู่ศูนย์ทางเรขาคณิต ยิ่งไปกว่านั้นฉันรู้วิธีที่จะพิสูจน์ว่าในกรณีพิเศษ "Orthonormal" แต่ฉันสับสนว่ามันทำงานอย่างไรในกรณีทั่วไปผ่าน "การสลายตัวทางสเปกตรัม"


4
คุณระบุว่าคุณสับสน แต่คำถามของคุณคืออะไร
whuber

คำตอบ:


30

คำถามปรากฏขึ้นเพื่อขอการสาธิตว่าการถดถอยของริดจ์ลดค่าสัมประสิทธิ์เป็นศูนย์โดยใช้การสลายตัวของสเปกตรัม การสลายตัวของสเปกตรัมสามารถเข้าใจได้ว่าเป็นผลมาจากการสลายตัวของเอกพจน์ (SVD) ดังนั้นโพสต์นี้เริ่มต้นด้วย SVD มันอธิบายในแง่ง่ายแล้วแสดงให้เห็นถึงการใช้งานที่สำคัญ จากนั้นจะแสดงการสาธิต (พีชคณิต) ตามที่ร้องขอ (แน่นอนว่าพีชคณิตนั้นเหมือนกับการสาธิตทางเรขาคณิตมันเป็นเพียงภาษาที่แตกต่างกัน)

แหล่งเดิมของคำตอบนี้สามารถพบได้ในบันทึกหลักสูตรการถดถอยของฉัน รุ่นนี้แก้ไขข้อผิดพลาดเล็กน้อย


SVD คืออะไร

ใด ๆเมทริกซ์XกับP n , สามารถเขียนได้X = U D V 'ที่n×pXpn

X=UDV
  1. เป็น n × Pเมทริกซ์Un×p

    • คอลัมน์ของมีความยาว1U1
    • คอลัมน์ของเป็นมุมฉากซึ่งกันและกันU
    • พวกเขาจะเรียกว่าองค์ประกอบหลักของXX
  2. เป็น P × Pเมทริกซ์Vp×p

    • คอลัมน์ของมีความยาว1V1
    • คอลัมน์ของเป็นมุมฉากซึ่งกันและกันV
    • นี้จะทำให้การหมุนของR PVRp
  3. คือเมทริกซ์ p × p ในแนวทแยงD p×p

    • องค์ประกอบเส้นทแยงมุมไม่ได้เป็นลบ เหล่านี้เป็นค่าเอกพจน์ของXd11,d22,,dppX
    • หากเราต้องการเราอาจสั่งให้พวกเขาจากมากที่สุดไปหาน้อยที่สุด

เกณฑ์ (1) และ (2) ยืนยันว่าทั้งและVเป็นเมทริกซ์แบบorthonormal พวกเขาสามารถสรุปได้อย่างเรียบร้อยโดยเงื่อนไขUV

UU=1p, VV=1p.

ผลที่ตามมา (นั่นคือหมายถึงการหมุน), V V = 1 pเช่นกัน สิ่งนี้จะถูกใช้ในการสืบทอดการถดถอยแบบสันด้านล่างVVV=1p

มันทำอะไรให้เรา

มันสามารถลดความซับซ้อนของสูตร สิ่งนี้ใช้ได้ทั้งเชิงพีชคณิตและแนวคิด นี่คือตัวอย่างบางส่วน.

สมการปกติ

พิจารณาการถดถอยที่เป็นปกติεมีความเป็นอิสระและกระจายกันไปตามกฎหมายที่มีศูนย์ความคาดหวังและความแปรปรวน จำกัดσ 2 วิธีการแก้ปัญหาน้อยสแควร์ผ่านทางปกติคือสมการβ = ( X ' X ) - 1 X ' Y การใช้ SVD และทำให้ระเบียบพีชคณิตที่ทำให้เกิดผลลัพธ์ (ซึ่งเป็นเรื่องง่าย) ทำให้เข้าใจได้ง่าย:y=Xβ+εεσ2

β^=(XX)1Xy.

(X'X)-1X'=((ยูDV')'(ยูDV'))-1(ยูDV')'=(VDยู'ยูDV')-1(VDยู')=VD-2V'VDยู'=VD-1ยู'.

ข้อแตกต่างระหว่างสิ่งนี้กับคือการใช้ส่วนกลับขององค์ประกอบของD ! กล่าวอีกนัยหนึ่ง "สมการ" y = X βได้รับการแก้ไขโดย "การแปลงกลับ" X : สิ่งนี้หลอก - ผกผันยกเลิกการหมุนรอบตัวคุณและV (เพียงแค่เปลี่ยนพวกมัน) และยกเลิกการคูณ (แทนด้วยD ) ในแต่ละหลัก ทิศทาง.X'=VDยู'DY=XβXยูV'D

สำหรับการอ้างอิงในอนาคตแจ้งให้ทราบว่า "หมุน" ประมาณการ βมีผลรวมเชิงเส้นของ "หมุน" การตอบสนองU ' Y ค่าสัมประสิทธิ์มีแปรผกผันของ (บวก) องค์ประกอบเส้นทแยงมุมของDเท่ากับd - 1 ฉันฉันV'β^ยู'YDdผมผม-1

ความแปรปรวนร่วมของการประมาณค่าสัมประสิทธิ์

จำได้ว่าความแปรปรวนของการประมาณการเป็น ใช้ SVD นี้จะกลายเป็นσ 2 ( V D 2 V ' ) - 1 = σ 2 V D - 2 V ' กล่าวอีกนัยหนึ่งความแปรปรวนร่วมกระทำเช่นเดียวกับตัวแปรk orthogonalแต่ละตัวมีค่าความแปรปรวนd 2 i i

Cov(β^)=σ2(X'X)-1.
σ2(VD2V')-1=σ2VD-2V'.
k dผมผม2ที่ได้รับการหมุนใน kRk

เมทริกซ์ Hat

เมทริกซ์หมวกเป็น โดยวิธีการของผลก่อนหน้านี้เราอาจจะเขียนมันเป็นH = ( U D V ' ) ( V D - 1 U ' ) = U U ' ! ง่าย

H=X(X'X)-1X'.
H=(ยูDV')(VD-1ยู')=ยูยู'.

Eigenanalysis (การสลายตัวของสเปกตรัม)

X'X=VDยู'ยูDV'=VD2V'
XX'=ยูDV'VDยู'=ยูD2ยู',
  • X'XXX'
  • VX'X
  • ยูXX'

SVD สามารถวินิจฉัยและแก้ไขปัญหา collinearity

การประมาณค่าถดถอย

ยูDV'ยูY

การถดถอยของสัน

XYXλ>0

β^R=(X'X+λ)-1X'Y=(VD2V'+λ1พี)-1VDยู'Y=(VD2V'+λVV')-1VDยู'Y=(V(D2+λ)V')-1VDยู'Y=V(D2+λ)-1V'VDยู'Y=V(D2+λ)-1Dยู'Y.

β^D-1=D-2D(D2+λ)-1DD2/(D2+λ)λ>0


ผลที่ได้นี้จะต้องมีความเข้าใจในความรู้สึกที่ค่อนข้างบอบบางพาดพิงถึงก่อนหน้านี้ที่: หมุนประมาณการV'β^Rยู'Ydผมผม-1dผมผม2/(dผมผม2+λ)λβ^R

dผมผม-1


1
@Glen_b เป็นจุดที่ดี: ฉันจำเป็นต้องมีความชัดเจนเกี่ยวกับเศษส่วนที่ฉันกำลังพิจารณา! ฉันจะแก้ไขมัน
whuber

1
ยูยู'=1พียู11 (2)VV=1pตามจากการสังเกตที่V1=1VV'=1พีVV-1(V-1)'(V-1)=1พีV-1=V'VV'=(V')'V'=1พี

1
@Vimal ขอบคุณสำหรับคำแนะนำที่ดี ตอนนี้ฉันได้รวมคำอธิบายไว้ในส่วน "สมการปกติ" ซึ่งมีการแนะนำตัวแบบการถดถอย
whuber

1
X
VDยู'=X'=X=ยูDV'.
ยู=VX

1
Y^
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.