ไม่ใช่ทุกขั้นตอนทางสถิติแบ่งออกเป็นข้อมูลการฝึกอบรม / การทดสอบเรียกอีกอย่างว่า "การตรวจสอบข้าม" (แม้ว่ากระบวนการทั้งหมดเกี่ยวข้องกับมากกว่านั้นเล็กน้อย)
แต่นี่เป็นเทคนิคที่ใช้ประเมินความผิดพลาดนอกตัวอย่างโดยเฉพาะ นั่นคือแบบจำลองของคุณจะทำนายผลลัพธ์ใหม่โดยใช้ชุดข้อมูลใหม่ได้ดีเพียงใด สิ่งนี้จะกลายเป็นปัญหาที่สำคัญมากเมื่อคุณมีตัวอย่างเช่นตัวทำนายจำนวนมากซึ่งสัมพันธ์กับจำนวนตัวอย่างในชุดข้อมูลของคุณ ในกรณีเช่นนี้มันเป็นเรื่องง่ายมากที่จะสร้างแบบจำลองที่มีข้อผิดพลาดในตัวอย่างที่ดี แต่มีข้อผิดพลาดจากตัวอย่างแย่มาก (เรียกว่า "over fitting") ในกรณีที่คุณมีทั้งตัวทำนายจำนวนมากและตัวอย่างจำนวนมากการตรวจสอบความถูกต้องไขว้เป็นเครื่องมือที่จำเป็นเพื่อช่วยประเมินว่าตัวแบบจะทำงานได้ดีเพียงใดเมื่อทำนายข้อมูลใหม่ นอกจากนี้ยังเป็นเครื่องมือสำคัญเมื่อเลือกระหว่างแบบจำลองการทำนายการแข่งขัน
ในหมายเหตุอื่นการตรวจสอบความถูกต้องไขว้มักใช้เมื่อพยายามสร้างแบบจำลองการทำนาย โดยทั่วไปจะไม่เป็นประโยชน์สำหรับรุ่นเมื่อคุณพยายามที่จะประเมินผลของการรักษาบางอย่าง ตัวอย่างเช่นหากคุณกำลังเปรียบเทียบการกระจายแรงดึงระหว่างวัสดุ A และ B ("การรักษา" เป็นประเภทวัสดุ) การตรวจสอบข้ามจะไม่จำเป็น ในขณะที่เราหวังว่าเราคาดผลการรักษา generalizes จากตัวอย่างสำหรับปัญหาส่วนใหญ่สถิติทฤษฎีคลาสสิกสามารถตอบคำถามนี้ (เช่นข้อผิดพลาด "มาตรฐาน" ของการประมาณการ) มากขึ้นได้อย่างแม่นยำกว่าการตรวจสอบข้าม น่าเสียดายที่วิธีการทางสถิติแบบดั้งเดิม1สำหรับข้อผิดพลาดมาตรฐานไม่ได้ค้างไว้ในกรณี overfitting การตรวจสอบข้ามมักจะทำได้ดีกว่ามากในกรณีนั้น
ในทางกลับกันหากคุณพยายามทำนายว่าวัสดุจะแยกตามตัวแปรที่วัดได้ 10,000 ตัวแปรที่คุณนำไปใช้ในรูปแบบการเรียนรู้ของเครื่องจักรโดยมีการสังเกต 100,000 ครั้งคุณจะมีปัญหามากมายในการสร้างแบบจำลองที่ยอดเยี่ยม
ฉันคาดเดาจากการทดลองทางฟิสิกส์มากมายที่ทำคุณมักสนใจการประเมินผลกระทบ ในกรณีเหล่านั้นมีความต้องการน้อยมากสำหรับการตรวจสอบข้าม
1อาจโต้แย้งได้ว่าวิธีการแบบเบย์พร้อมข้อมูลอันทรงเกียรติเป็นวิธีการทางสถิติแบบดั้งเดิม แต่นั่นเป็นอีกการสนทนา
หมายเหตุด้านข้าง:ในขณะที่การตรวจสอบความถูกต้องของข้อมูลปรากฏขึ้นครั้งแรกในวรรณกรรมทางสถิติและมีการใช้งานโดยผู้ที่เรียกตัวเองว่านักสถิติมันกลายเป็นเครื่องมือพื้นฐานที่จำเป็นในชุมชนการเรียนรู้ของเครื่อง แบบจำลองสถิติจำนวนมากจะทำงานได้ดีโดยไม่ต้องใช้การตรวจสอบความถูกต้องไขว้ แต่เกือบทุกรุ่นที่พิจารณาว่า "การเรียนรู้แบบจำลองการเรียนรู้ด้วยเครื่อง" ต้องมีการตรวจสอบความถูกต้องแบบข้ามเนื่องจากพวกเขามักจะต้องเลือกการปรับค่าพารามิเตอร์ -validation