แน่นอนคุณต้องตัดสินใจเกี่ยวกับอัตราส่วนการแยกสำหรับการสุ่มใหม่ (สองครั้ง) ...
อย่างไรก็ตามการ resampling มักใช้กับอัตราส่วนการแบ่งค่อนข้างกว้างถ้าคุณจำไว้
- ไม่ต้องทำแบบลาก่อนว่าจะลดจำนวนการใช้งานที่แตกต่างออกไปได้หรือไม่
- ปล่อยให้กรณีการฝึกอบรมเพียงพอในชุดการฝึกอบรมด้านในสุดดังนั้นอัลกอริทึมการติดตามมีโอกาสเหมาะสมในการสร้างแบบจำลองที่มีประโยชน์
- กรณีที่เป็นอิสระมากขึ้นคุณมีความสำคัญน้อยกว่าคือการพิจารณาเหล่านี้
และถ้าคุณทำงานกับข้อมูลขนาดใหญ่ (แต่ไม่ใช่ข้อมูลขนาดใหญ่) ที่ 10,000 <N <1000000
คุณสามารถทำอะไรได้ถ้าคุณไม่แน่ใจว่าจำเป็นต้องมีการ resampling ใหม่เมื่อใด: resample สองสามครั้ง เพียงพอดังนั้นคุณสามารถวัดได้ว่าจำเป็นต้องมีการสุ่มตัวอย่างใหม่หรือไม่
- ตรวจสอบความมั่นคงของการทำนายของคุณ
- ตรวจสอบความเสถียรของพารามิเตอร์โมเดลของคุณ
ด้วยผลลัพธ์เหล่านี้คุณสามารถตัดสินใจได้ว่าคุณควรเพิ่มการวนซ้ำซ้ำซ้ำอีกหรือไม่