การตีความเชิงเรขาคณิตของการถดถอยเชิงเส้นเชิงลงโทษ


26

ฉันรู้ว่าการถดถอยเชิงเส้นสามารถคิดได้ว่า"เส้นที่ใกล้เคียงที่สุดในทุกจุด" :

ป้อนคำอธิบายรูปภาพที่นี่

แต่มีวิธีอื่นในการดูโดยการแสดงพื้นที่คอลัมน์ในขณะที่"การฉายภาพลงบนพื้นที่ที่ทอดโดยคอลัมน์ของเมทริกซ์สัมประสิทธิ์" :

ป้อนคำอธิบายรูปภาพที่นี่

คำถามของฉันคือในทั้งสองการตีความสิ่งที่เกิดขึ้นเมื่อเราใช้การถดถอยเชิงเส้นลงโทษเช่นการถดถอยสันเขาและ เชือก ? เกิดอะไรขึ้นกับบรรทัดในการตีความครั้งแรก และจะเกิดอะไรขึ้นกับการประมาณการในการตีความครั้งที่สอง?

UPDATE: @JohnSmith แสดงความคิดเห็นว่ามีการลงโทษเกิดขึ้นในพื้นที่ของสัมประสิทธิ์ มีการตีความในพื้นที่นี้ด้วยหรือไม่


1
ฉันไม่แน่ใจว่าเป็นไปได้ที่จะเกิดการตีความเช่นนี้ขึ้น เพียงเพราะสิ่งที่คุณระบุเป็นภาพในพื้นที่ดั้งเดิมของคุณสมบัติและการตอบกลับ และการถดถอยที่ถูกลงโทษนั้นเกี่ยวข้องกับพื้นที่ของสัมประสิทธิ์ซึ่งแตกต่างกันมาก
Dmitry Laptev

"เส้นแนวตั้งใกล้จุดทั้งหมดมากที่สุด"? หนึ่งมักจะใช้เวลารวมของสี่เหลี่ยม - เห็นภาพที่ดีในวิกิพีเดียCoefficient_of_determination ผลรวมของระยะทางแนวดิ่งคือบรรทัดฐาน L1 ซึ่งไม่ไวต่อค่าผิดปกติ แต่พบได้น้อยกว่ามาก
เดนิส

คำตอบ:


21

ขออภัยสำหรับทักษะการวาดภาพของฉันฉันจะพยายามให้ปรีชาดังต่อไปนี้

f(β)ββ1β2

มีฟังก์ชั่นนี้น้อยที่สุดในช่วงกลางวงกลมสีแดง และขั้นต่ำนี้ให้วิธีการที่ไม่ถูกลงโทษ

g(β)g(β)=λ(|β1|+|β2|)g(β)=λ(β12+β22)λλg(x)

f(β)+g(β)

LASSO และการถดถอยของสัน

การลงโทษที่มากขึ้นรูปทรงสีฟ้า "แคบลง" ที่เราได้รับจากนั้นแผนการพบกันในจุดที่ใกล้กว่าศูนย์ ในทางกลับกัน: การลงโทษที่มีขนาดเล็กกว่า, รูปทรงขยายและจุดตัดของแผนการสีน้ำเงินและสีแดงจะเข้ามาใกล้จุดศูนย์กลางของวงกลมสีแดงมากขึ้น

β1=0β2=0

0

หวังว่าจะอธิบายสัญชาตญาณเกี่ยวกับวิธีการถดถอยการลงโทษในพื้นที่ของพารามิเตอร์


ฉันคิดว่าเริ่มต้นด้วยภาพคลาสสิกอย่างที่คุณทำมันเป็นการเริ่มต้นที่ดี เพื่อให้เข้าใจสิ่งนี้จริงๆฉันคิดว่ามันจะเป็นประโยชน์ในการอธิบายว่ารูปทรงเกี่ยวข้องกับปัญหาอย่างไร โดยเฉพาะอย่างยิ่งเรารู้ในทั้งสองกรณีว่ายิ่งเราลงโทษน้อยเท่าไหร่ยิ่งเราเข้าใกล้โซลูชัน OLS มากเท่าไหร่ก็ยิ่งได้รับมากขึ้นยิ่งใกล้กับโมเดลสกัดกั้นที่บริสุทธิ์มากขึ้นเท่านั้น คำถามหนึ่งที่ต้องถามคือ: สิ่งนี้ปรากฏออกมาในรูปของคุณอย่างไร?
พระคาร์ดินัล

อย่างไรก็ตามทักษะการวาดภาพของคุณก็ดูดี
พระคาร์ดินัล

ขอบคุณสำหรับความคิดเห็นของคุณ! ทุกอย่างเรียบง่ายอย่างสังหรณ์ใจที่นี่: บทลงโทษที่ใหญ่กว่ารูปทรงสีฟ้า "แคบลง" ที่เราได้รับ ในทางกลับกัน: การลงโทษที่มีขนาดเล็ก: ยิ่งเข้าใกล้จุดศูนย์กลางของวงกลมสีแดงมากเท่าไหร่แผนการจะได้พบกัน (OLS)
Dmitry Laptev

2
g(x)λ

1
ขอบคุณสำหรับภาพประกอบที่ชัดเจน ฉันได้อ่านที่อื่นว่าผลรวมขั้นต่ำของวัตถุประสงค์เกิดขึ้นเมื่อพวกเขาสัมผัสกัน ฉันเข้าใจว่าถ้า f (\ beta) '= -g (\ beta)' นั่นจะหมายถึงอนุพันธ์ของผลรวมเป็นศูนย์ซึ่งเป็นข้อกำหนดสำหรับ extremum นี่คือสิ่งที่มีความหมายที่นี่โดย "เมื่อสองเส้นชั้นความสูงพบกัน"?
odedbd

3

สัญชาตญาณที่ฉันมีต่อไปนี้: ในกรณีที่กำลังสองน้อยที่สุดเมทริกซ์ของหมวกคือการฉายฉากมุมฉากดังนั้น idempotent ในกรณีที่ถูกลงโทษเมทริกซ์ของหมวกจะไม่เป็น idempotent อีกต่อไป จริงๆแล้วการใช้หลาย ๆ ครั้งจะลดค่าสัมประสิทธิ์กับจุดกำเนิด ในทางตรงกันข้ามค่าสัมประสิทธิ์ยังคงต้องอยู่ในช่วงของการทำนายดังนั้นมันจึงยังคงเป็นภาพแม้จะไม่ใช่มุมฉาก ขนาดของปัจจัยการลงโทษและประเภทของบรรทัดฐานจะควบคุมระยะทางและทิศทางของการหดตัวต่อแหล่งกำเนิด


1
ฉันมองไม่เห็นว่าทำไมมันไม่ใช่ idempotent: ถ้าฉันคาดเวกเตอร์ในอวกาศ (แม้ว่าจะไม่ใช่มุมฉากมุมฉาก) และฉันวางข้อ จำกัด ในสัมประสิทธิ์เหตุใดการประมาณการใหม่ของเวกเตอร์ที่ฉายนี้จะแตกต่างจากก่อนหน้า หนึ่ง?
Lucas Reis

1
สังหรณ์ใจ: สมมติว่าคุณกำลังลดผลรวมกำลังสองของการลงโทษเป็นครั้งที่สอง ผลรวมของกำลังสองที่การย่อขนาดที่สองนั้นเล็กกว่าผลรวมของกำลังสองของการย่อเล็กสุดแรก ความสำคัญเชิงสัมพัทธ์ของบรรทัดฐานสัมประสิทธิ์ของการลงโทษจะเพิ่มขึ้นกล่าวคือมีมากกว่าที่จะได้รับจากการลดค่าสัมประสิทธิ์ลงอีก การถดถอยของสันเขาเป็นตัวอย่างที่ดีที่คุณมีรูปแบบปิดที่ดีสำหรับเมทริกซ์ของหมวกและคุณสามารถตรวจสอบได้โดยตรงว่าเป็น idempotent หรือไม่
JohnRos
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.