ฉันมีข้อมูลบางส่วนและฉันต้องการสร้างแบบจำลอง (พูดแบบจำลองการถดถอยเชิงเส้น) จากข้อมูลนี้ ในขั้นตอนถัดไปฉันต้องการใช้การตรวจสอบความถูกต้องแบบข้ามใบ (LOOCV) กับโมเดลเพื่อดูว่ามันทำงานได้ดีเพียงใด
ถ้าฉันเข้าใจ LOOCV ถูกต้องฉันจะสร้างแบบจำลองใหม่สำหรับตัวอย่างแต่ละชุด (ชุดทดสอบ) โดยใช้ทุกตัวอย่างยกเว้นตัวอย่างนี้ (ชุดฝึกอบรม) แล้วฉันจะใช้รูปแบบในการทำนายชุดทดสอบและคำนวณข้อผิดพลาด{จริง})
ในขั้นตอนต่อไปฉันรวมข้อผิดพลาดทั้งหมดที่สร้างขึ้นโดยใช้ฟังก์ชั่นที่เลือกตัวอย่างเช่นหมายถึงข้อผิดพลาดกำลังสอง ฉันสามารถใช้ค่าเหล่านี้เพื่อตัดสินคุณภาพ (หรือความเหมาะสมของแบบ) ของโมเดล
คำถาม:แบบจำลองใดเป็นแบบจำลองคุณภาพค่าเหล่านี้ใช้สำหรับแบบใดฉันควรเลือกแบบใดหากฉันพบว่าตัวชี้วัดที่สร้างจาก LOOCV เหมาะสมกับกรณีของฉัน LOOCV ดูที่รุ่นที่แตกต่างกัน (โดยที่คือขนาดตัวอย่าง); ฉันควรเลือกรุ่นใด
- มันเป็นรุ่นที่ใช้ตัวอย่างทั้งหมดหรือไม่ แบบจำลองนี้ไม่เคยคำนวณในระหว่างกระบวนการ LOOCV!
- เป็นรุ่นที่มีข้อผิดพลาดน้อยที่สุดหรือไม่