ฉันคิดที่จะแก้ Lasso ผ่านวิธีการ subgradient วานิลลา แต่ฉันได้อ่านคนที่แนะนำให้ใช้การไล่ระดับสีแบบ Proximal บางคนสามารถเน้นว่าทำไม GD GD ใกล้เคียงแทนที่จะใช้วิธีการ subgradient วานิลลาสำหรับ Lasso?
ฉันคิดที่จะแก้ Lasso ผ่านวิธีการ subgradient วานิลลา แต่ฉันได้อ่านคนที่แนะนำให้ใช้การไล่ระดับสีแบบ Proximal บางคนสามารถเน้นว่าทำไม GD GD ใกล้เคียงแทนที่จะใช้วิธีการ subgradient วานิลลาสำหรับ Lasso?
คำตอบ:
วิธีการแก้ปัญหาโดยประมาณสามารถพบได้จริงสำหรับ Lasso โดยใช้วิธีการ subgradient ตัวอย่างเช่นสมมติว่าเราต้องการลดฟังก์ชันการสูญเสียต่อไปนี้:
การไล่ระดับสีของระยะลูกโทษเป็นสำหรับและสำหรับแต่ระยะลูกโทษเป็น nondifferentiable ที่0แต่เราสามารถใช้ subgradientซึ่งเป็นเหมือนกัน แต่มีค่าเป็นสำหรับ0
subgradient ที่สอดคล้องกันสำหรับฟังก์ชั่นการสูญเสียคือ:
เราสามารถลดฟังก์ชั่นการสูญเสียให้น้อยที่สุดโดยใช้วิธีที่คล้ายกับการไล่ระดับสีไล่ระดับ แต่ใช้ subgradient (ซึ่งเท่ากับระดับการไล่ระดับสีทุกที่ยกเว้นซึ่งการไล่ระดับสีไม่ได้กำหนดไว้) วิธีการแก้ปัญหาอาจอยู่ใกล้กับโซลูชั่น Lasso ที่แท้จริง แต่อาจไม่มีศูนย์ที่แน่นอน - ที่ซึ่งน้ำหนักควรจะเป็นศูนย์ แต่จะมีค่าน้อยมากแทน การขาด sparsity ที่แท้จริงนี้เป็นเหตุผลหนึ่งที่ไม่ใช้วิธีการ subgradient สำหรับ lasso นักแก้ปัญหาเฉพาะจะใช้ประโยชน์จากโครงสร้างปัญหาเพื่อผลิตโซลูชั่นที่กระจัดกระจายอย่างแท้จริงในวิธีที่มีประสิทธิภาพในการคำนวณ โพสต์นี้กล่าวว่านอกเหนือจากการผลิตสารละลายแบบเบาบางแล้ววิธีการเฉพาะ (รวมถึงวิธีการไล่ระดับสีแบบใกล้เคียง) มีอัตราการลู่เข้าที่เร็วกว่าวิธีการแบบ subgradient เขาให้การอ้างอิงบางอย่าง