LASSO ความสัมพันธ์ระหว่าง


10

ความเข้าใจของฉันเกี่ยวกับการถดถอย LASSO คือสัมประสิทธิ์การถดถอยถูกเลือกเพื่อแก้ปัญหาการย่อเล็กสุด:

minβyXβ22 s.t.β1t

ในทางปฏิบัติสิ่งนี้ทำได้โดยใช้ตัวคูณลากรองจ์ทำให้เกิดปัญหาในการแก้ปัญหา

minβyXβ22+λβ1

ความสัมพันธ์ระหว่างλกับtคืออะไร? วิกิพีเดียอย่างไม่ช่วยเหลือเพียงแค่ระบุว่า "ขึ้นอยู่กับข้อมูล"

ทำไมฉันถึงแคร์ ประการแรกสำหรับความอยากรู้ทางปัญญา แต่ฉันก็กังวลเกี่ยวกับผลที่ตามมาสำหรับการเลือกλโดยการตรวจสอบข้าม

โดยเฉพาะถ้าฉันใช้การตรวจสอบความถูกต้องแบบครอส n-fold ฉันพอดีกับโมเดลที่แตกต่างกันกับ n พาร์ติชั่นต่าง ๆ ของข้อมูลการฝึกอบรมของฉัน จากนั้นฉันจะเปรียบเทียบความแม่นยำของโมเดลแต่ละรุ่นกับข้อมูลที่ไม่ได้ใช้สำหรับλระบุ แต่\ lambdaเดียวกันλหมายถึงข้อ จำกัด ที่แตกต่างกัน ( t ) สำหรับชุดย่อยที่แตกต่างกันของข้อมูล (เช่นt=f(λ)คือ "data dependent")

ไม่ใช่ปัญหาการตรวจสอบข้ามที่ฉันต้องการแก้เพื่อค้นหาtที่ให้การแลกเปลี่ยนอคติที่แม่นยำที่สุดหรือไม่

ฉันสามารถทำความเข้าใจคร่าวๆเกี่ยวกับขนาดของเอฟเฟกต์นี้ในทางปฏิบัติโดยการคำนวณβ1สำหรับการแยกการตรวจสอบข้ามแต่ละครั้งและλและดูการกระจายที่เกิดขึ้น ในบางกรณีข้อ จำกัด โดยนัย ( t ) อาจแตกต่างกันอย่างเงียบ ๆ อย่างมีนัยสำคัญในส่วนย่อยการตรวจสอบข้ามของฉัน ในกรณีที่โดยสาระสำคัญที่ผมหมายถึงค่าสัมประสิทธิ์ของการเปลี่ยนแปลงในt>>0 0


5
การ upvoting เพื่อยกเลิก downvote ที่ไม่ได้อธิบาย คำถามนั้นอยู่นอกเหนือความเชี่ยวชาญของฉัน แต่ดูเหมือนว่ามีเหตุผล
mkt - Reinstate Monica

คำตอบ:


2

นี่คือโซลูชันมาตรฐานสำหรับการถดถอยของสันเขา :

β=(XX+λI)1Xy

เราก็รู้ว่าดังนั้นจะต้องเป็นจริงที่β=t

(XX+λI)1Xy=t
t

ซึ่งไม่ได้เป็นเรื่องง่ายที่จะแก้ปัญหาสำหรับ\λ

ทางออกที่ดีที่สุดของคุณคือการทำสิ่งที่คุณทำต่อไป: คำนวณในตัวอย่างย่อยเดียวกันของข้อมูลข้ามค่าหลายค่าtλ

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.