สูตรทั้งสองนั้นเทียบเท่ากันในแง่ที่ว่าทุกค่าของในสูตรแรกมีค่าของสำหรับสูตรที่สองซึ่งสูตรทั้งสองนั้นมี minimizerเดียวกันเสื้อλβ
นี่คือเหตุผล:
พิจารณาสูตร lasso:
ปล่อยให้ minimizer เป็นและ ให้ขการเรียกร้องของฉันคือว่าถ้าคุณตั้งค่าในการกำหนดแรกแล้วการแก้ปัญหาของสูตรแรกยังจะ * นี่คือข้อพิสูจน์:
ฉ( β) = 12| | Y- Xβ| |22+ λ | | β| |1
β* * * *b = | | β* * * *| |1t = bβ* * * *
พิจารณาสูตรแรก
ถ้าเป็นไปได้ให้สูตรที่สองนี้มีทางออกเช่นนั้น (สังเกตเครื่องหมายน้อยกว่าอย่างเคร่งครัด) จากนั้นจึงง่ายที่จะเห็นว่าขัดแย้งกับข้อเท็จจริงที่ว่าเป็นวิธีแก้ปัญหาสำหรับบ่วง ดังนั้นวิธีการแก้สูตรแรกคือยัง *บีตา | | บีตา | | 1<| | β∗| | 1=ขฉ( β )<F(β*)β*β*
ขั้นต่ำ12| | Y- Xβ| |22 เซนต์| | β| |1≤ b
β^| | β^| |1< | | β* * * *| |1= bฉ( β^) < f( β* * * *)β* * * *β* * * *
ตั้งแต่สภาพความสะเพร่าที่สมบูรณ์มีความพึงพอใจในการแก้ปัญหาจุด *β ∗t = bβ* * * *
ดังนั้นเมื่อกำหนดสูตร lasso ด้วยคุณต้องสร้างสูตรแบบ จำกัด โดยใช้เท่ากับค่าของบรรทัดฐานของสารละลาย Lasso ในทางกลับกันเมื่อกำหนดสูตรด้วยคุณจะพบซึ่งวิธีแก้ปัญหาของ lasso จะเท่ากับโซลูชันของ formulation ที่ จำกัดλl 1 t λเสื้อล.1เสื้อλ
(ถ้าคุณรู้เกี่ยวกับ subgradients คุณสามารถหานี้ได้โดยการแก้สมการ , โดยที่X T ( Y - X β * ) = λ Z * Z * ∈ ∂ | | β ∗ | | 1 )λXT( y- Xβ* * * *) = λ z* * * *Z* * * *∈ ∂| | β* * * *| |1)