นี่เป็นหัวข้อใหญ่ ดังที่ได้กล่าวไว้ก่อนหน้านี้ Hastie, Tibshirani และ Friedman ให้คำแนะนำที่ดีใน Ch3 ขององค์ประกอบของการเรียนรู้ทางสถิติ
คะแนนน้อย 1) คุณหมายถึงอะไรโดย "ดีที่สุด" หรือ "ดีที่สุด" สิ่งที่ดีที่สุดในแง่หนึ่งอาจไม่ดีที่สุดในอีกแง่หนึ่ง เกณฑ์ทั่วไปสองข้อคือความแม่นยำในการทำนาย (การทำนายตัวแปรผลลัพธ์) และสร้างค่าประมาณที่ไม่เอนเอียงของสัมประสิทธิ์ วิธีการบางอย่างเช่น Lasso & Ridge Regression ย่อมสร้างตัวประมาณค่าสัมประสิทธิ์ความเอนเอียงอย่างหลีกเลี่ยงไม่ได้
2) วลี "ชุดย่อยที่ดีที่สุด" สามารถใช้ในประสาทสัมผัสทั้งสองได้ โดยทั่วไปจะอ้างถึงชุดย่อยที่ดีที่สุดในการทำนายทั้งหมดซึ่งปรับเกณฑ์การสร้างแบบจำลอง โดยเฉพาะอย่างยิ่งมันสามารถอ้างถึงอัลกอริทึมที่มีประสิทธิภาพของ Furnival และ Wilson สำหรับการค้นหาเซตย่อยในจำนวนปานกลาง (~ 50) ของตัวทำนายเชิงเส้น (ถดถอยโดย Leaps และขอบเขต Technometrics, Vol. 16, No. 4 (Nov. , 1974), pp. 499-51)
http://www.jstor.org/stable/1267601