การประยุกต์ใช้การถดถอยของริดจ์กับระบบสมการที่บ่อนทำลาย?


9

เมื่อปัญหากำลังสองน้อยที่สุดซึ่งกำหนดข้อ จำกัด เป็นทรงกลมบนค่าของ\ betaสามารถเขียนเป็น \ start {สมการ} \ \ \ {array} & \ operatorname {min} \ \ | y - X \ beta \ | ^ 2_2 \\ \ operatorname {st} \ \ | \ beta \ | ^ 2_2 \ le \ delta ^ 2 \ end {array} \ end {สมการ} สำหรับระบบ overdetermined \ | \ cdot \ | _2เป็นบรรทัดฐานแบบยุคลิดของเวกเตอร์y=Xβ+eδβ

min yXβ22s.t.  β22δ2
2

โซลูชันที่สอดคล้องกับβได้รับโดย

β^=(XTX+λI)1XTy ,
ซึ่งสามารถได้มาจากวิธีการคูณลากรองจ์ ( λคือตัวคูณ):
L(β,λ)=yXβ22+λ(β22δ2)

ฉันเข้าใจว่ามีคุณสมบัติที่

(XTX+λI)1XT=XT(XXT+λI)1 .
ทางด้านขวามือมีลักษณะคล้ายกับ pseudo-inverse ของ regressor matrix Xในกรณีที่ไม่ได้กำหนด (ด้วยพารามิเตอร์การทำให้เป็นมาตรฐานλ ) หมายความว่าหมายความว่าสามารถใช้นิพจน์เดียวกันเพื่อประมาณβสำหรับกรณีที่ถูกกำหนดไม่ได้? มีการแยกที่มาสำหรับการแสดงออกที่สอดคล้องกันในกรณี underdetermined เป็นข้อ จำกัด การ จำกัด ทรงกลมซ้ำซ้อนกับฟังก์ชั่นวัตถุประสงค์ (บรรทัดฐานขั้นต่ำของβ ):

min. β2s.t. Xβ=y .

คำตอบ:


12

เริ่มต้นด้วยการกำหนดปัญหาการถดถอยของสันเขาดังนี้

minXβy22+λx22

คุณสามารถเขียนปัญหาเป็น

minAβb22

ที่ไหน

A=[XλI]

และ

b=[y0].

เมทริกซ์มียศคอลัมน์เต็มเพราะส่วนหนึ่ง ดังนั้นปัญหากำลังสองน้อยที่สุดเป็นวิธีแก้ปัญหาเฉพาะAλI

β^=(ATA)1ATb

เขียนสิ่งนี้ในรูปของและและทำให้ 0 เป็นจำนวนมากได้ง่ายขึ้นXy

β^=(XTX+λI)1XTy

ไม่มีอะไรในที่มานี้ขึ้นอยู่กับว่ามีแถวหรือคอลัมน์มากขึ้นหรือแม้กระทั่งว่ามีอันดับเต็ม สูตรนี้จึงใช้กับกรณีที่ไม่ได้ระบุไว้ XX

มันเป็นความจริงเชิงพีชคณิตสำหรับ ,λ>0

(XTX+λI)1XT=XT(XXT+λI)1

ดังนั้นเรายังมีตัวเลือกในการใช้

β^=XT(XXT+λI)1y Y

ในการตอบคำถามเฉพาะของคุณ:

  1. ใช่สูตรทั้งสองใช้ได้กับกรณีที่ไม่ได้ระบุไว้และกรณีที่กำหนดไว้มากเกินไป พวกเขายังทำงานถ้ามีค่าน้อยกว่าขั้นต่ำของจำนวนแถวและคอลัมน์ของXรุ่นที่สองสามารถมีประสิทธิภาพมากขึ้นสำหรับปัญหาที่ไม่ได้ระบุเนื่องจากมีขนาดเล็กกว่าในกรณีนั้น rank(X)XXXTXTX

  2. ฉันไม่ได้ตระหนักถึงสูตรทางเลือกที่เริ่มต้นด้วยปัญหากำลังสองน้อยที่สุดและใช้สมการปกติ ไม่ว่าในกรณีใดคุณจะได้รับมันในแบบตรงไปตรงมาโดยใช้พีชคณิตเล็กน้อย

เป็นไปได้ว่าคุณกำลังคิดถึงปัญหาการถดถอยของสันเขาในรูปแบบ

minβ22

ภายใต้

Xβy22ϵ.

อย่างไรก็ตามปัญหาการถดถอยของสันเขารุ่นนี้จะนำไปสู่ปัญหากำลังสองน้อยที่สุดที่เหมือนกัน{2}minXβy22+λβ22


2
มันน่าสังเกตว่าเกิดอะไรขึ้นในขีด จำกัด เนื่องจากไปที่ 0 ถ้ามีอันดับแถวเต็มหรืออันดับคอลัมน์เต็มรูปแบบ ถ้ามียศคอลัมน์เต็มรูปแบบแล้วในวงเงินที่คุณจะได้รับ pseudoinverse{X} ในทำนองเดียวกันถ้ามียศแถวเต็มรูปแบบแล้วในวงเงินที่คุณจะได้รับ pseudoinverse1} ดังนั้นสิ่งนี้ได้ผลตามที่เราคาดหวัง λXX(XTX)1XTXXT(XXT)1
Brian Borchers

นี่เป็นคำตอบที่ครอบคลุมอย่างน่าอัศจรรย์และการได้มาของอาร์เรย์ที่เพิ่มขึ้น (บวกกับพีชคณิตที่ฉันพลาด) นั้นน่าพอใจมาก ฉันไม่ได้คิดถึงปัญหาการถดถอยของสันเขาในรูปแบบที่คุณนำเสนอในตอนท้าย แต่มันน่าสนใจที่จะเห็นว่ามันนำไปสู่การทำงานตามวัตถุประสงค์เดียวกัน ขอบคุณมาก!
hatmatrix

1
ขอบคุณ ฉันจะใส่ปลั๊กไร้ยางอายที่นี่ - คุณสามารถค้นหาสิ่งนี้ (และเนื้อหาที่เกี่ยวข้องจำนวนมาก) ในหนังสือเรียนเกี่ยวกับการประมาณค่าพารามิเตอร์และปัญหาผกผันที่ฉันได้ร่วมกับ Rick Aster และ Cliff Thurber
Brian Borchers

1
ขอผมเพิ่มเติมด้วยว่าการคำนวณเมทริกซ์ผกผันนี้ไม่ใช่วิธีที่ดีที่สุดในการใช้สูตรนี้ ทั้งนี้ขึ้นอยู่กับขนาดและความเป็นไปได้ของ sparsityคุณอาจจะมากดีกว่าการใช้รูปแบบการซ้ำหรือเพียงแค่ใช้ตัวประกอบ Cholesky ของเมทริกซ์แลมบ์ดาฉัน XXTX+λI
Brian Borchers

ขอบคุณสำหรับคำแนะนำของคุณ! ฉันขอขอบคุณที่อ้างอิงถึงหนังสือของคุณเนื่องจากฉันมีปัญหาในการหาตำราเกี่ยวกับหนังสือเล่มนี้ ขนาดข้อมูลของเรานั้นไม่ใหญ่มาก (เฉพาะที่เราอาจต้องใช้หลายครั้งนี้เพื่อแยกชุดข้อมูล) ดังนั้นจึงอาจตอบสนองการผกผันโดยตรง แต่ขอขอบคุณสำหรับคำแนะนำเพิ่มเติม!
hatmatrix
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.