วิธีการนี้จะอธิบายในกระดาษ glmnet regularization เส้นทางสำหรับการเชิงเส้นทั่วไปรุ่นผ่านทางประสานงานโคตร แม้ว่าวิธีการที่นี่มีไว้สำหรับกรณีทั่วไปของการทำให้เป็นมาตรฐานทั้งและแต่ก็ควรใช้กับ LASSO (เฉพาะ ) เช่นกันL1L2L1
วิธีแก้ปัญหาสำหรับสูงสุดมีให้ในหัวข้อ 2.5 λ
เมื่อเราเห็นจาก (5) ว่าจะคงอยู่ที่ศูนย์ถ้า\ ดังนั้นβ~= 0β~J1ยังไม่มีข้อความ| ⟨ xJ, y⟩ | < λ อัลฟ่ายังไม่มีข้อความอัลฟ่าλm a x= สูงสุดล.| ⟨ xล., y⟩ |
นั่นคือเราสังเกตว่ากฎการอัปเดตสำหรับเบต้าบังคับให้พารามิเตอร์ทั้งหมดประมาณเป็นศูนย์สำหรับตามที่กำหนดไว้ด้านบนλ > λm a x
การกำหนดและจำนวนของจุดกริดดูเหมือนจะมีหลักการน้อยลง ใน glmnet พวกเขาตั้งค่าแล้วเลือกกริดคะแนนที่เว้นระยะเท่ากันในระดับลอการิทึม λ m i n = 0.001 ∗ λ m a x 100λm ฉันnλm ฉันn= 0.001 ∗ λm a x100
วิธีนี้ใช้ได้ผลดีในการใช้งาน glmnet อย่างกว้างขวางฉันไม่เคยพบว่ากริดนี้มีความหยาบเกินไป
ใน LASSO ( ) เฉพาะกรณีที่สิ่งต่าง ๆ ทำงานได้ดีขึ้นเนื่องจากวิธีLARSให้การคำนวณที่แม่นยำสำหรับเมื่อตัวทำนายต่างๆเข้าสู่โมเดล LARS ที่แท้จริงไม่ได้ทำการค้นหากริดบนแทนที่จะสร้างนิพจน์ที่แน่นอนสำหรับเส้นทางการแก้ปัญหาสำหรับค่าสัมประสิทธิ์
นี่คือรายละเอียดการคำนวณเส้นทางสัมประสิทธิ์ในกรณีตัวทำนายสองแบบอย่างละเอียด λL1λ
กรณีสำหรับโมเดลที่ไม่ใช่เชิงเส้น (เช่นโลจิสติกปัวซอง) นั้นยากกว่า อยู่ในระดับสูงครั้งแรกประมาณกำลังสองฟังก์ชั่นการสูญเสียที่จะได้รับค่าพารามิเตอร์เริ่มต้นแล้วคำนวณข้างต้นจะถูกใช้ในการกำหนด{} การคำนวณเส้นทางพารามิเตอร์ที่แม่นยำนั้นไม่สามารถทำได้ในกรณีเหล่านี้แม้ว่าจะมีการกำหนดมาตรฐานให้เฉพาะการใช้งานเท่านั้นดังนั้นการค้นหากริดจึงเป็นตัวเลือกเดียวλ m a x L 1β= 0λm a xL1
น้ำหนักตัวอย่างยังทำให้สถานการณ์ซับซ้อนขึ้นผลิตภัณฑ์ภายในจะต้องถูกแทนที่ในสถานที่ที่เหมาะสมด้วยผลิตภัณฑ์ภายในที่มีน้ำหนัก