ทำไมสืบเชื้อสายการไล่ระดับสีใกล้เคียงแทนวิธีการ subgradient ธรรมดาสำหรับ Lasso?


9

ฉันคิดที่จะแก้ Lasso ผ่านวิธีการ subgradient วานิลลา แต่ฉันได้อ่านคนที่แนะนำให้ใช้การไล่ระดับสีแบบ Proximal บางคนสามารถเน้นว่าทำไม GD GD ใกล้เคียงแทนที่จะใช้วิธีการ subgradient วานิลลาสำหรับ Lasso?

คำตอบ:


14

วิธีการแก้ปัญหาโดยประมาณสามารถพบได้จริงสำหรับ Lasso โดยใช้วิธีการ subgradient ตัวอย่างเช่นสมมติว่าเราต้องการลดฟังก์ชันการสูญเสียต่อไปนี้:

(W;λ)=Y-XW22+λW1

การไล่ระดับสีของระยะลูกโทษเป็นสำหรับและสำหรับแต่ระยะลูกโทษเป็น nondifferentiable ที่0แต่เราสามารถใช้ subgradientซึ่งเป็นเหมือนกัน แต่มีค่าเป็นสำหรับ0-λWผม<0λWผม>00λSGN(W)0Wผม=0

subgradient ที่สอดคล้องกันสำหรับฟังก์ชั่นการสูญเสียคือ:

ก.(W;λ)=-2XT(Y-XW)+λSGN(W)

เราสามารถลดฟังก์ชั่นการสูญเสียให้น้อยที่สุดโดยใช้วิธีที่คล้ายกับการไล่ระดับสีไล่ระดับ แต่ใช้ subgradient (ซึ่งเท่ากับระดับการไล่ระดับสีทุกที่ยกเว้นซึ่งการไล่ระดับสีไม่ได้กำหนดไว้) วิธีการแก้ปัญหาอาจอยู่ใกล้กับโซลูชั่น Lasso ที่แท้จริง แต่อาจไม่มีศูนย์ที่แน่นอน - ที่ซึ่งน้ำหนักควรจะเป็นศูนย์ แต่จะมีค่าน้อยมากแทน การขาด sparsity ที่แท้จริงนี้เป็นเหตุผลหนึ่งที่ไม่ใช้วิธีการ subgradient สำหรับ lasso นักแก้ปัญหาเฉพาะจะใช้ประโยชน์จากโครงสร้างปัญหาเพื่อผลิตโซลูชั่นที่กระจัดกระจายอย่างแท้จริงในวิธีที่มีประสิทธิภาพในการคำนวณ โพสต์นี้0กล่าวว่านอกเหนือจากการผลิตสารละลายแบบเบาบางแล้ววิธีการเฉพาะ (รวมถึงวิธีการไล่ระดับสีแบบใกล้เคียง) มีอัตราการลู่เข้าที่เร็วกว่าวิธีการแบบ subgradient เขาให้การอ้างอิงบางอย่าง

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.