คุณต้องการเลือกชุดย่อยของตัวทำนายตามเกณฑ์บางอย่าง อาจเป็น AIC ในตัวอย่างหรือปรับ R ^ 2 หรือการตรวจสอบความถูกต้องไขว้ไม่สำคัญ
คุณสามารถทดสอบการรวมกันของเซตย่อยของตัวทำนายและเลือกชุดย่อยที่ดีที่สุด อย่างไรก็ตาม
- ใช้เวลานานมากเนื่องจากการระเบิดของพารามิเตอร์แบบ combinatorial
- ใช้งานได้หากคุณมีพารามิเตอร์มากกว่าการสังเกตในแง่ที่ว่าคุณทดสอบชุดค่าผสมของตัวทำนายทั้งหมดที่ให้ทางแก้ไข
คุณสามารถใช้การเลือกตามลำดับขั้นตอนไปข้างหน้า
- ใช้เวลาน้อยลง แต่อาจไม่ได้รับชุดค่าผสมที่ดีที่สุดอย่างแน่นอน เมื่อตัวทำนายมีความสัมพันธ์กัน (อาจเลือกตัวทำนายหนึ่งตัวและไม่สามารถปรับปรุงเพิ่มเติมได้เมื่อเพิ่มตัวทำนายอื่นอีก 2 ตัวที่จะแสดงการปรับปรุง)
- ทำงานได้แม้ในขณะที่คุณมีพารามิเตอร์มากกว่าการสังเกต
คุณสามารถใช้การกำจัดแบบย้อนหลัง
- ใช้งานไม่ได้หากคุณมีพารามิเตอร์มากกว่าการสังเกตไม่มีจุดเริ่มต้นที่ดีเพียงอย่างเดียว (ในทางทฤษฎีคุณสามารถเริ่มจากจุดเริ่มต้นที่ถูกต้องทั้งหมดทำงานย้อนหลังเลือกอันที่ดีที่สุด
- เช่นเดียวกับการก้าวไปข้างหน้าใช้เวลาน้อยกว่าชุดย่อยทั้งหมด แต่อาจไม่ได้รับชุดค่าผสมที่ดีที่สุดอย่างสมบูรณ์ เมื่อทำนายมีความสัมพันธ์
คุณสามารถใช้ LASSO
- ทำงานได้แม้ในขณะที่คุณมีพารามิเตอร์มากกว่าการสังเกต
- ประสิทธิภาพของ CPU เมื่อคุณมีพารามิเตอร์จำนวนมากและการระเบิดย่อยของ combinatorial
- เพิ่มการทำให้เป็นปกติ
สำหรับคำถามของคุณว่าเหตุใด LASSO จึงทำงานได้ดีขึ้นกับข้อมูลของคุณใน CV
- ความเป็นไปได้อย่างหนึ่งคือการพึ่งพาพา ธ ที่อธิบายไว้ข้างต้น - LASSO อาจพบเซตย่อยที่ดีกว่า บางทีมันอาจจะโชคดีบางที LASSO โดยทั่วไป / บางครั้งอาจได้ชุดย่อยที่ดีกว่าฉันไม่แน่ใจ อาจมีวรรณกรรมเกี่ยวกับเรื่องนี้
- ความเป็นไปได้อื่น ๆ (ที่เป็นไปได้มากกว่า) คือการทำให้เป็นมาตรฐานของ LASSO จะป้องกันการเกิด overfitting ดังนั้น LASSO จึงทำงานได้ดีขึ้นใน CV / ตัวอย่างออก
บรรทัดล่าง LASSO ให้การกำหนดมาตรฐานและการเลือกชุดย่อยที่มีประสิทธิภาพโดยเฉพาะอย่างยิ่งเมื่อคุณมีผู้ทำนายจำนวนมาก
BTW คุณสามารถทำ LASSO และเลือกรุ่นของคุณโดยใช้ CV (ส่วนใหญ่) แต่ยังใช้ AIC หรือเกณฑ์อื่น ๆ รันโมเดลของคุณด้วยการทำให้เป็นมาตรฐาน L1 และไม่มีข้อ จำกัด จากนั้นค่อย ๆ กระชับข้อ จำกัด จนกว่า AIC จะถึงข้อผิดพลาดน้อยที่สุดหรือข้อผิดพลาด CV หรือเกณฑ์ที่คุณเลือก ดูhttp://scikit-learn.org/stable/auto_examples/linear_model/plot_lasso_model_selection.html