มีความแตกต่างที่สำคัญระหว่างการประเมินโดยใช้บทลงโทษประเภทสันเขาและบทลงโทษประเภทเชือก ตัวประมาณชนิดสันมีแนวโน้มที่จะลดค่าสัมประสิทธิ์การถดถอยทั้งหมดให้เป็นศูนย์และมีความลำเอียง แต่มีการแจกแจงแบบอะซิมโทติกได้ง่ายเพราะพวกมันไม่หดตัวตัวแปรใด ๆ ให้เป็นศูนย์ ความเอนเอียงในการประมาณสันอาจเป็นปัญหาในการทดสอบสมมติฐานต่อไป แต่ฉันไม่ใช่ผู้เชี่ยวชาญในเรื่องนั้น ในทางกลับกันการลงโทษประเภท Lasso / elastic-net ลดค่าสัมประสิทธิ์การถดถอยจำนวนมากเป็นศูนย์และดังนั้นจึงสามารถดูได้ว่าเป็นเทคนิคการเลือกรูปแบบ ปัญหาของการทำการอนุมานบนแบบจำลองที่เลือกขึ้นอยู่กับข้อมูลมักเรียกว่าปัญหาการอนุมานแบบเลือกหรือการอนุมานภายหลังการเลือก สาขานี้ได้เห็นการพัฒนาจำนวนมากในปีที่ผ่านมา
ปัญหาหลักของการอนุมานหลังจากการเลือกรุ่นคือการเลือกตัดทอนพื้นที่ตัวอย่าง ตัวอย่างง่ายๆสมมติว่าเราสังเกตY∼ N( μ , 1 ) และต้องการประมาณเท่านั้น μถ้าเรามีหลักฐานว่ามันใหญ่กว่าศูนย์ จากนั้นเราประมาณμ ถ้า | Y| >c>0 สำหรับบางเกณฑ์ที่กำหนดไว้ล่วงหน้า ค. ในกรณีเช่นนี้เราจะสังเกตเท่านั้นY ถ้ามันมีขนาดใหญ่กว่า ค ในค่าสัมบูรณ์และดังนั้น Y ไม่ปกติอีกต่อไป แต่ถูกตัดทอนตามปกติ
ในทำนองเดียวกัน Lasso (หรือ elastic net) จำกัด พื้นที่ตัวอย่างด้วยวิธีการเพื่อให้แน่ใจว่ามีการเลือกรุ่นที่เลือก การตัดปลายนี้มีความซับซ้อนมากขึ้น แต่สามารถอธิบายได้เชิงวิเคราะห์
จากข้อมูลเชิงลึกนี้เราสามารถทำการอนุมานโดยพิจารณาจากการกระจายข้อมูลที่ถูกตัดทอนเพื่อรับสถิติการทดสอบที่ถูกต้อง สำหรับช่วงความมั่นใจและสถิติการทดสอบดูงานของ Lee et al .:
http://projecteuclid.org/euclid.aos/1460381681
วิธีการของพวกเขาจะดำเนินการในแพคเกจการ R selectiveInference
การประมาณค่าที่เหมาะสมที่สุด (และการทดสอบ) หลังจากการเลือกแบบจำลองถูกกล่าวถึงใน (สำหรับ lasso):
https://arxiv.org/abs/1705.09417
และแพ็คเกจซอฟต์แวร์ (ครอบคลุมน้อยกว่า) มีให้ใน:
https://github.com/ammeir2/selectiveMLE