ความซับซ้อนของเวลาในการถดถอยของ Lasso คืออะไร?


14

ความซับซ้อนเวลา asymptotic ของการถดถอยแบบ Lasso เมื่อจำนวนแถวหรือคอลัมน์เพิ่มขึ้นเท่าไหร่?

คำตอบ:


4

จำได้ว่าเชือกเป็นรูปแบบเชิงเส้นกับl1 regularization

การค้นหาพารามิเตอร์สามารถกำหนดได้ว่าเป็นปัญหาการปรับให้เหมาะสมแบบไม่มีข้อ จำกัด ซึ่งกำหนดพารามิเตอร์โดย

argminβ||yXβ||2+α||β||1

ในการกำหนดสูตรพารามิเตอร์จะได้รับจาก

argminβ||yXβ||2s.t.||β||1<α

ซึ่งเป็นปัญหาการเขียนโปรแกรมกำลังสองและพหุนาม

รูทีนการออปติไมซ์เชิงคอนเวอเรจเกือบทั้งหมดแม้กระทั่งสำหรับสิ่งที่ไม่เชิงเส้นที่มีความยืดหยุ่นเช่นเครือข่ายนิวรัลให้พึ่งพาการคำนวณอนุพันธ์ของพารามิเตอร์ wrt เป้าหมายของคุณ คุณไม่สามารถหาอนุพันธ์ของได้ เช่นนี้คุณต้องพึ่งพาเทคนิคที่แตกต่างกัน มีวิธีการมากมายในการค้นหาพารามิเตอร์ นี่เป็นกระดาษตรวจสอบในเรื่องการเพิ่มประสิทธิภาพแควน้อยกับ L1-นอร์ม regularization ความซับซ้อนของเวลาในการเพิ่มประสิทธิภาพของการวนซ้ำแบบวนซ้ำนั้นค่อนข้างยุ่งยากในการวิเคราะห์เนื่องจากมันขึ้นอยู่กับเกณฑ์การลู่เข้า โดยทั่วไปปัญหาวนซ้ำมารวมกันในยุคที่น้อยลงเมื่อการสังเกตเพิ่มขึ้นα||w||1


4
มีหลายสิ่ง: การบอกว่าปัญหาคือ "พหุนาม" นั้นไม่ได้มีประโยชน์อะไรเป็นพิเศษเว้นแต่คุณอาจกำลังมองปัญหา combinatorics บางประเภท (ซึ่งโดยปกติจะเป็นการอธิบาย) ประการที่สองการคำนวณอนุพันธ์นั้นค่อนข้างไม่ได้เป็นขั้นตอนที่ จำกัด ประการที่สามโดยทั่วไปเมื่อพูดถึงความซับซ้อนของเวลาของอัลกอริทึมซ้ำหนึ่งมักจะดูที่ค่าใช้จ่ายต่อขั้นตอนและดังนั้นจึงไม่ขึ้นอยู่กับเกณฑ์การบรรจบกัน ในที่สุดมันก็ไม่ใช่กรณีที่การสังเกตเพิ่มเติม = การวนซ้ำน้อยลง
หน้าผา AB

13

ในขณะที่ @JacobMick ให้ภาพรวมที่กว้างขึ้นและลิงก์ไปยังบทความวิจารณ์ให้ฉันให้คำตอบ "ทางลัด" (ซึ่งอาจเป็นกรณีพิเศษของคำตอบของเขา)

ให้จำนวนของตัวแปรผู้สมัคร (คุณสมบัติคอลัมน์) จะและขนาดของกลุ่มตัวอย่าง (จำนวนสังเกตแถว) เป็นnพิจารณา LASSO ที่ใช้งานโดยใช้อัลกอริทึม LARS ( Efron et al., 2004 ) ความซับซ้อนในการคำนวณของ LASSO คือ ( ibid. )n O ( K 3 + K 2 n )KnO(K3+K2n)

  • สำหรับ ,และความซับซ้อนในการคำนวณของ LASSO คือซึ่งเหมือนกับการถดถอยด้วยตัวแปร ( Efron et al., 2004 , หน้า 443-444, อ้างถึงในSchmidt, 2005 , ส่วน 2.4; สำหรับความซับซ้อนในการคำนวณของการถดถอย, ดูโพสต์นี้ )K 3 < K 2 n O ( K 2 n ) KK<nK3<K2nO(K2n)K
  • สำหรับ ,และความซับซ้อนในการคำนวณของ LASSO คือ ( Efron et al., 2004 )K 3K 2 n O ( K 3 )KnK3K2nO(K3)

อ้างอิง:


ริชาร์ดคุณสามารถแสดงความคิดเห็นในการย้ำความซับซ้อนสำหรับวิธีการ GLM ที่นี่stats.stackexchange.com/questions/280304/... ?
rnoodle

@moodle ฉันไม่สามารถเจาะลึกลงไปได้ (ซึ่งตอนนี้ฉันไม่มีเวลา) แต่ +1 คำถามของคุณ
Richard Hardy

ฉันได้ดู แต่ไม่ชัดเจน - น่าจะดีที่จะได้ตาที่สอง ดังนั้นจึงมีความซับซ้อนซ้ำและความซับซ้อนบรรจบกันและฉันคิดว่าวรรณกรรมค่อนข้างคลุมเครือในบางครั้งคำจำกัดความ โดยทั่วไปฉันมีอัลกอริทึมที่ใช้ตัวแก้เชือกในตำแหน่งที่สำคัญมากเช่นความซับซ้อนของอัลกอริทึมของฉันขึ้นอยู่กับตัวแก้ จะดีกับเล็บนี้ ไชโย! ฉันจะให้รางวัลสำหรับสิ่งที่คุณป้อน
rnoodle

@rnoodle ฉันสงสัยอย่างมากว่าฉันจะสามารถช่วยเหลือคุณได้ตลอดเวลาเร็ว ๆ นี้ แต่ความโปรดปรานอาจดึงดูดผู้คนที่รู้จักดีขึ้นอย่างแน่นอน โชคดี!
Richard Hardy
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.