การเลือกช่วงและความหนาแน่นของกริดสำหรับพารามิเตอร์การทำให้เป็นมาตรฐานใน LASSO


12

ฉันกำลังศึกษาLASSO (อย่างน้อยการหดตัวแบบสัมบูรณ์และผู้ดำเนินการคัดเลือก) ในเวลาเดียวกัน ฉันเห็นว่าค่าที่ดีที่สุดสำหรับพารามิเตอร์การทำให้เป็นมาตรฐานสามารถเลือกได้โดยการตรวจสอบความถูกต้องข้าม ฉันเห็นด้วยในการถดถอยของสันเขาและวิธีการมากมายที่ใช้การทำให้เป็นมาตรฐานเราสามารถใช้ CV เพื่อค้นหาพารามิเตอร์การทำให้เป็นมาตรฐานที่ดีที่สุด (การลงโทษ) ตอนนี้คำถามของฉันเกี่ยวกับค่าเริ่มต้นสำหรับขอบเขตบนและล่างของพารามิเตอร์และวิธีการกำหนดความยาวของลำดับ

จะเฉพาะเจาะจงเช่นสมมติเรามีปัญหา Lasso และเราต้องการที่จะหาค่าที่ดีที่สุดสำหรับการลงโทษ\แล้วเราจะเลือกขอบเขตล่างและบนสำหรับอย่างไร และมีค่าเท่าไรที่แยกระหว่างสองค่า ? λ λ [ = ? , b = ? ] ( b - a )

LogLikelihood=(yxβ)(yxβ)+λ|β|1
λλ[a=?,b=?](ba)k=?

คำถามที่เกี่ยวข้องที่นี่
Richard Hardy

คำตอบ:


13

วิธีการนี้จะอธิบายในกระดาษ glmnet regularization เส้นทางสำหรับการเชิงเส้นทั่วไปรุ่นผ่านทางประสานงานโคตร แม้ว่าวิธีการที่นี่มีไว้สำหรับกรณีทั่วไปของการทำให้เป็นมาตรฐานทั้งและแต่ก็ควรใช้กับ LASSO (เฉพาะ ) เช่นกันL1L2L1

วิธีแก้ปัญหาสำหรับสูงสุดมีให้ในหัวข้อ 2.5 λ

เมื่อเราเห็นจาก (5) ว่าจะคงอยู่ที่ศูนย์ถ้า\ ดังนั้นβ~=0β~J1ยังไม่มีข้อความ|xJ,Y|<λαยังไม่มีข้อความαλม.ax=สูงสุดล.|xล.,Y|

นั่นคือเราสังเกตว่ากฎการอัปเดตสำหรับเบต้าบังคับให้พารามิเตอร์ทั้งหมดประมาณเป็นศูนย์สำหรับตามที่กำหนดไว้ด้านบนλ>λม.ax

การกำหนดและจำนวนของจุดกริดดูเหมือนจะมีหลักการน้อยลง ใน glmnet พวกเขาตั้งค่าแล้วเลือกกริดคะแนนที่เว้นระยะเท่ากันในระดับลอการิทึม λ m i n = 0.001 λ m a x 100λม.ผมnλม.ผมn=0.001* * * *λม.ax100

วิธีนี้ใช้ได้ผลดีในการใช้งาน glmnet อย่างกว้างขวางฉันไม่เคยพบว่ากริดนี้มีความหยาบเกินไป

ใน LASSO ( ) เฉพาะกรณีที่สิ่งต่าง ๆ ทำงานได้ดีขึ้นเนื่องจากวิธีLARSให้การคำนวณที่แม่นยำสำหรับเมื่อตัวทำนายต่างๆเข้าสู่โมเดล LARS ที่แท้จริงไม่ได้ทำการค้นหากริดบนแทนที่จะสร้างนิพจน์ที่แน่นอนสำหรับเส้นทางการแก้ปัญหาสำหรับค่าสัมประสิทธิ์ นี่คือรายละเอียดการคำนวณเส้นทางสัมประสิทธิ์ในกรณีตัวทำนายสองแบบอย่างละเอียด λL1λ

กรณีสำหรับโมเดลที่ไม่ใช่เชิงเส้น (เช่นโลจิสติกปัวซอง) นั้นยากกว่า อยู่ในระดับสูงครั้งแรกประมาณกำลังสองฟังก์ชั่นการสูญเสียที่จะได้รับค่าพารามิเตอร์เริ่มต้นแล้วคำนวณข้างต้นจะถูกใช้ในการกำหนด{} การคำนวณเส้นทางพารามิเตอร์ที่แม่นยำนั้นไม่สามารถทำได้ในกรณีเหล่านี้แม้ว่าจะมีการกำหนดมาตรฐานให้เฉพาะการใช้งานเท่านั้นดังนั้นการค้นหากริดจึงเป็นตัวเลือกเดียวλ m a x L 1β=0λม.axL1

น้ำหนักตัวอย่างยังทำให้สถานการณ์ซับซ้อนขึ้นผลิตภัณฑ์ภายในจะต้องถูกแทนที่ในสถานที่ที่เหมาะสมด้วยผลิตภัณฑ์ภายในที่มีน้ำหนัก

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.