ความซับซ้อนเวลา asymptotic ของการถดถอยแบบ Lasso เมื่อจำนวนแถวหรือคอลัมน์เพิ่มขึ้นเท่าไหร่?
ความซับซ้อนเวลา asymptotic ของการถดถอยแบบ Lasso เมื่อจำนวนแถวหรือคอลัมน์เพิ่มขึ้นเท่าไหร่?
คำตอบ:
จำได้ว่าเชือกเป็นรูปแบบเชิงเส้นกับ regularization
การค้นหาพารามิเตอร์สามารถกำหนดได้ว่าเป็นปัญหาการปรับให้เหมาะสมแบบไม่มีข้อ จำกัด ซึ่งกำหนดพารามิเตอร์โดย
ในการกำหนดสูตรพารามิเตอร์จะได้รับจาก
ซึ่งเป็นปัญหาการเขียนโปรแกรมกำลังสองและพหุนาม
รูทีนการออปติไมซ์เชิงคอนเวอเรจเกือบทั้งหมดแม้กระทั่งสำหรับสิ่งที่ไม่เชิงเส้นที่มีความยืดหยุ่นเช่นเครือข่ายนิวรัลให้พึ่งพาการคำนวณอนุพันธ์ของพารามิเตอร์ wrt เป้าหมายของคุณ คุณไม่สามารถหาอนุพันธ์ของได้ เช่นนี้คุณต้องพึ่งพาเทคนิคที่แตกต่างกัน มีวิธีการมากมายในการค้นหาพารามิเตอร์ นี่เป็นกระดาษตรวจสอบในเรื่องการเพิ่มประสิทธิภาพแควน้อยกับ L1-นอร์ม regularization ความซับซ้อนของเวลาในการเพิ่มประสิทธิภาพของการวนซ้ำแบบวนซ้ำนั้นค่อนข้างยุ่งยากในการวิเคราะห์เนื่องจากมันขึ้นอยู่กับเกณฑ์การลู่เข้า โดยทั่วไปปัญหาวนซ้ำมารวมกันในยุคที่น้อยลงเมื่อการสังเกตเพิ่มขึ้น
ในขณะที่ @JacobMick ให้ภาพรวมที่กว้างขึ้นและลิงก์ไปยังบทความวิจารณ์ให้ฉันให้คำตอบ "ทางลัด" (ซึ่งอาจเป็นกรณีพิเศษของคำตอบของเขา)
ให้จำนวนของตัวแปรผู้สมัคร (คุณสมบัติคอลัมน์) จะและขนาดของกลุ่มตัวอย่าง (จำนวนสังเกตแถว) เป็นnพิจารณา LASSO ที่ใช้งานโดยใช้อัลกอริทึม LARS ( Efron et al., 2004 ) ความซับซ้อนในการคำนวณของ LASSO คือ ( ibid. )n O ( K 3 + K 2 n )
อ้างอิง: