k -Fold Cross Validation
สมมติว่าคุณมี 100 จุดข้อมูล สำหรับการตรวจสอบความถูกต้องข้ามของk -fold 100 คะแนนเหล่านี้จะแบ่งออกเป็นkเท่าขนาดเท่ากันและ 'folds' ร่วมกัน แต่เพียงผู้เดียว สำหรับk = 10 คุณอาจกำหนดคะแนน 1-10 เพื่อพับ # 1, 11-20 เพื่อพับ # 2 และอื่น ๆ โดยจบด้วยการกำหนดคะแนน 91-100 เพื่อพับ # 10 ต่อไปเราเลือกหนึ่งเท่าเพื่อทำหน้าที่เป็นชุดทดสอบและใช้k−1เท่าที่เหลือเพื่อจัดทำข้อมูลการฝึกอบรม สำหรับการทดสอบครั้งแรกคุณอาจใช้คะแนน 1-10 เป็นชุดทดสอบและ 11-100 เป็นชุดฝึก การทดสอบครั้งต่อไปจะใช้คะแนน 11-20 เป็นชุดทดสอบและฝึกซ้อมที่คะแนน 1-10 บวก 21-100 และต่อ ๆ ไปจนกว่าจะใช้การพับแต่ละครั้งหนึ่งครั้งเป็นชุดทดสอบ
การตรวจสอบความถูกต้องของ Monte-Carlo
Monte Carlo ทำงานค่อนข้างแตกต่าง คุณสุ่มเลือก (โดยไม่มีการแทนที่) ข้อมูลบางส่วนของคุณเพื่อจัดทำชุดการฝึกอบรมจากนั้นกำหนดคะแนนที่เหลือให้กับชุดทดสอบ กระบวนการนี้จะทำซ้ำหลายครั้งสร้างพาร์ติชันใหม่และการทดสอบ (โดยการสุ่ม) ในแต่ละครั้ง ตัวอย่างเช่นสมมติว่าคุณเลือกที่จะใช้ 10% ของข้อมูลของคุณเป็นข้อมูลทดสอบ จากนั้นชุดทดสอบของคุณใน rep # 1 อาจเป็นคะแนน 64, 90 , 63, 42 , 65, 49, 10, 64, 96 และ 48 ในการทดสอบครั้งต่อไปชุดทดสอบของคุณอาจเป็น90 , 60, 23, 67 16, 78, 42 , 17, 73 และ 26 เนื่องจากพาร์ติชันนั้นทำอย่างอิสระสำหรับการวิ่งแต่ละครั้งจุดเดียวกันสามารถปรากฏในชุดทดสอบได้หลายครั้งซึ่งเป็นความแตกต่างที่สำคัญระหว่าง Monte Carlo และการตรวจสอบข้าม
การเปรียบเทียบ
แต่ละวิธีมีข้อดีและข้อเสียของตัวเอง ภายใต้การตรวจสอบความถูกต้องไขว้แต่ละจุดจะได้รับการทดสอบหนึ่งครั้งซึ่งดูเหมือนว่ายุติธรรม อย่างไรก็ตามการตรวจสอบความถูกต้องไขว้สำรวจเพียงไม่กี่วิธีที่เป็นไปได้ที่ข้อมูลของคุณอาจได้รับการแบ่งพาร์ติชัน Monte Carlo ช่วยให้คุณสำรวจพาร์ทิชันที่เป็นไปได้ค่อนข้างมากแม้ว่าคุณจะไม่ได้รับพาร์ติชั่นทั้งหมด - มีวิธีที่เป็นไปได้ที่ 50/50 แยกจุดข้อมูล 100 จุด ชุด (!)(10050)≈1028
หากคุณกำลังพยายามที่จะอนุมาน (เช่นการเปรียบเทียบอัลกอริธึมสองสถิติ) การเฉลี่ยผลของการตรวจสอบความถูกต้องข้าม -fold จะทำให้คุณได้รับการประเมินประสิทธิภาพของอัลกอริทึมที่เกือบจะเป็นกลาง แต่มีความแปรปรวนสูง คาดหวังว่าจะมีเพียง 5 หรือ 10 จุดข้อมูล) โดยหลักการแล้วคุณสามารถรันมันได้นานเท่าที่คุณต้องการ / สามารถจ่ายได้การตรวจสอบข้าม Monte Carlo สามารถทำให้คุณมีตัวแปรน้อยลง แต่การประเมินแบบเอนเอียงมากขึ้นk
วิธีการบางอย่างหลอมรวมทั้งสองเช่นเดียวกับในการตรวจสอบข้าม 5x2 (ดูDietterich (1998)สำหรับความคิดแม้ว่าฉันคิดว่ามีการปรับปรุงเพิ่มเติมบางอย่างตั้งแต่นั้นมา) หรือโดยการแก้ไขอคติ (เช่นNadeau และ Bengio, 2003 ) .