ฉันคิดว่าคุณยังคงมีบางสิ่งที่ยังขาดความเข้าใจในจุดประสงค์ของการตรวจสอบข้าม
เรามาดูคำศัพท์ที่ตรงโดยทั่วไปเมื่อเราพูดว่า 'แบบจำลอง' เราอ้างถึงวิธีการเฉพาะสำหรับการอธิบายว่าข้อมูลอินพุตบางตัวเกี่ยวข้องกับสิ่งที่เราพยายามทำนายอย่างไร โดยทั่วไปเราไม่ได้อ้างถึงอินสแตนซ์เฉพาะของวิธีการนั้นเป็นแบบจำลองที่แตกต่างกัน ดังนั้นคุณอาจพูดว่า 'ฉันมีรูปแบบการถดถอยเชิงเส้น' แต่คุณจะไม่เรียกชุดค่าสัมประสิทธิ์ที่แตกต่างกันสองชุด อย่างน้อยไม่ได้อยู่ในบริบทของการเลือกแบบจำลอง
ดังนั้นเมื่อคุณทำการตรวจสอบความถูกต้องข้ามแบบ K-fold คุณกำลังทดสอบว่าแบบจำลองของคุณสามารถรับการฝึกอบรมจากข้อมูลบางส่วนได้ดีเพียงใดแล้วทำนายข้อมูลที่ไม่ได้เห็น เราใช้การตรวจสอบความถูกต้องแบบไขว้สำหรับสิ่งนี้เพราะหากคุณฝึกการใช้ข้อมูลทั้งหมดที่คุณมีคุณจะไม่เหลือการทดสอบ คุณสามารถทำได้เพียงครั้งเดียวพูดโดยใช้ข้อมูล 80% ในการฝึกอบรมและ 20% ในการทดสอบ แต่จะเกิดอะไรขึ้นถ้า 20% ที่คุณเลือกที่จะทดสอบเกิดขึ้นจะมีจุดต่าง ๆ ที่ง่ายมาก (หรือยากมาก) คาดการณ์ได้อย่างไร เราจะไม่เกิดขึ้นกับการประมาณการที่ดีที่สุดเท่าที่จะเป็นไปได้ของความสามารถของแบบจำลองในการเรียนรู้และทำนาย
เราต้องการใช้ข้อมูลทั้งหมด ดังนั้นเพื่อดำเนินการต่อตัวอย่างด้านบนของการแยก 80/20 เราจะทำการตรวจสอบข้ามแบบ 5 เท่าโดยการฝึกอบรมแบบจำลอง 5 ครั้งใน 80% ของข้อมูลและการทดสอบ 20% เรามั่นใจว่าจุดข้อมูลแต่ละจุดสิ้นสุดในชุดทดสอบ 20% หนึ่งครั้ง ดังนั้นเราจึงใช้ทุกจุดข้อมูลที่เราต้องมีส่วนร่วมในการทำความเข้าใจว่าแบบจำลองของเราทำงานได้ดีเพียงใดในการเรียนรู้จากข้อมูลบางส่วนและทำนายข้อมูลใหม่บางอย่าง
แต่จุดประสงค์ของการตรวจสอบข้ามไม่ได้เกิดขึ้นกับรุ่นสุดท้ายของเรา เราไม่ได้ใช้แบบจำลองที่ได้รับการฝึกฝนของเราทั้ง 5 กรณีนี้เพื่อทำการทำนายที่แท้จริง เพื่อที่เราต้องการใช้ข้อมูลทั้งหมดที่เราต้องมากับรูปแบบที่ดีที่สุด วัตถุประสงค์ของการตรวจสอบข้ามคือการตรวจสอบรูปแบบไม่ใช่การสร้างแบบจำลอง
ทีนี้สมมติว่าเรามีสองแบบกล่าวว่าแบบจำลองการถดถอยเชิงเส้นและโครงข่ายประสาท เราจะบอกได้อย่างไรว่าแบบจำลองไหนดีกว่า เราสามารถทำการตรวจสอบไขว้แบบ K-fold และดูว่าข้อใดพิสูจน์ได้ดีกว่าในการทำนายคะแนนชุดทดสอบ แต่เมื่อเราใช้การตรวจสอบความถูกต้องไขว้กันเพื่อเลือกแบบจำลองที่มีประสิทธิภาพดีกว่าเราจะฝึกแบบจำลองนั้น (ไม่ว่าจะเป็นการถดถอยเชิงเส้นหรือโครงข่ายประสาทเทียม) กับข้อมูลทั้งหมด เราไม่ได้ใช้อินสแตนซ์รุ่นจริงที่เราได้รับการฝึกอบรมระหว่างการตรวจสอบข้ามความถูกต้องสำหรับโมเดลการทำนายขั้นสุดท้ายของเรา
โปรดทราบว่ามีเทคนิคที่เรียกว่าการรวม bootstrap (มักย่อให้เป็น 'การห่อ') ซึ่งทำในลักษณะที่ใช้อินสแตนซ์ของแบบจำลองที่ผลิตในลักษณะที่คล้ายกับการตรวจสอบความถูกต้องข้ามเพื่อสร้างโมเดลทั้งหมด แต่นั่นเป็นเทคนิคขั้นสูง จากคำถามของคุณที่นี่