ฉันมีความคิดเกี่ยวกับข้อดีข้อเสียของการถดถอยสันและ LASSO แล้ว
สำหรับ LASSO คำสั่งลงโทษ L1 จะให้ค่าสัมประสิทธิ์แบบเบาบางซึ่งสามารถดูได้ว่าเป็นวิธีการเลือกคุณลักษณะ อย่างไรก็ตามมีข้อ จำกัด บางประการสำหรับ LASSO หากคุณสมบัติมีความสัมพันธ์สูง LASSO จะเลือกหนึ่งในนั้นเท่านั้น นอกจากนี้สำหรับปัญหาที่ > LASSO จะเลือกพารามิเตอร์มากที่สุด (และคือจำนวนการสังเกตและพารามิเตอร์ตามลำดับ) สิ่งเหล่านี้ทำให้ LASSO สังเกตุว่าเป็นวิธีที่ไม่ดีในแง่ของความสามารถในการคาดการณ์เมื่อเทียบกับการถดถอยของสันเขา
สำหรับการถดถอยของสันเขามันให้การคาดการณ์ที่ดีกว่าโดยทั่วไป อย่างไรก็ตามความสามารถในการตีความไม่ดีเท่า LASSO
คำอธิบายข้างต้นมักพบได้ในหนังสือเรียนในการเรียนรู้ของเครื่อง / การขุดข้อมูล อย่างไรก็ตามฉันยังคงสับสนเกี่ยวกับสองสิ่ง:
หากเราทำให้ช่วงของคุณลักษณะเป็นปกติ (พูดระหว่าง 0 ถึง 1 หรือด้วยค่าเฉลี่ยศูนย์และความแปรปรวนของหน่วย) และเรียกใช้การถดถอยของสันเขาเรายังคงมีแนวคิดสำคัญของคุณลักษณะโดยการเรียงลำดับค่าสัมบูรณ์ของสัมประสิทธิ์ ค่าสัมประสิทธิ์สัมบูรณ์สูงสุดของสัมบูรณ์) แม้ว่าเราจะไม่ได้เลือกคุณสมบัติอย่างชัดเจน แต่การตีความก็ไม่ได้หายไปจากการถดถอยของสันเขา ในขณะเดียวกันเรายังสามารถบรรลุพลังการทำนายสูง ถ้าอย่างนั้นทำไมเราถึงต้องการ LASSO ฉันทำอะไรบางอย่างหายไปหรือเปล่า
LASSO เป็นที่ต้องการเนื่องจากลักษณะการเลือกคุณสมบัติหรือไม่? เพื่อความเข้าใจของฉันเหตุผลที่เราต้องเลือกคุณสมบัติคือความสามารถในการพูดคุยทั่วไปและความสะดวกในการคำนวณ
เพื่อความสะดวกในการคำนวณเราไม่ต้องการฟีดทั้งหมด 1 ล้านฟีเจอร์ในแบบจำลองของเราหากเราทำงาน NLP บางอย่างดังนั้นเราจึงวางฟีเจอร์ไร้ประโยชน์บางอย่างลงก่อนเพื่อลดต้นทุนการคำนวณ อย่างไรก็ตามสำหรับ LASSO เราสามารถรู้ได้เฉพาะผลการเลือกคุณสมบัติ (เวกเตอร์แบบกระจาย) หลังจากที่เราป้อนข้อมูลทั้งหมดในแบบจำลองของเราดังนั้นเราจึงไม่ได้รับประโยชน์จาก LASSO ในแง่ของการลดต้นทุนการคำนวณ เราสามารถคาดการณ์ได้เร็วขึ้นเพียงเล็กน้อยในขณะนี้ขณะนี้เราป้อนฟีเจอร์ย่อย (พูด 500 จาก 1 ล้านรายการ) ลงในโมเดลของเราเพื่อสร้างผลลัพธ์ที่คาดการณ์ไว้
ถ้า LASSO นั้นต้องการความสามารถในการพูดคุยทั่วไปเราก็สามารถบรรลุเป้าหมายเดียวกันได้โดยใช้การถดถอยแบบสัน (หรือการทำให้เป็นมาตรฐานแบบอื่น) ทำไมเราถึงต้องการ LASSO (หรือมุ้งยืด) อีกครั้ง? ทำไมเราถึงติดสันเขาถดถอยไม่ได้?
ใครบางคนช่วยส่องแสงไฟนี้ให้หน่อยได้ไหม? ขอบคุณ!