ตัวอย่าง Bootstrap ใช้เพื่อประเมินประสิทธิภาพของอัลกอริทึมด้วยการวนซ้ำจำนวนมาก ในขณะที่ทำเช่นนั้นประสิทธิภาพของชุดการเปลี่ยนแปลงแบบสุ่มจะถูกประเมิน
ในทางตรงกันข้ามเมื่อทำเช่นการตรวจสอบความถูกต้อง 10 เท่าของ Cross คุณกำลังทำซ้ำเพียง 10 ครั้งบนชุดข้อมูลรถไฟและชุดทดสอบที่แตกต่างกัน
n = 20ฉัน= 10 , 000
ลิงก์ที่คุณโพสต์ลงดังนั้นฉันจึงเพิ่มคำอธิบายของฟังก์ชั่นในเวอร์ชัน sklearn ปัจจุบัน (0.14)
คำอธิบายของวิธีการ
การสุ่มตัวอย่างแบบสุ่มด้วยการแทนที่การตรวจสอบความถูกต้องแบบข้ามให้ดัชนีรถไฟ / ทดสอบเพื่อแยกข้อมูลในชุดทดสอบรถไฟขณะที่ทำการสุ่มตัวอย่างอินพุต n_iter อีกครั้ง: ทุกครั้งที่มีการสุ่มแยกใหม่ของข้อมูลแล้วสุ่มตัวอย่าง (แทน) แต่ละด้าน ของการแยกเพื่อสร้างชุดการฝึกอบรมและการทดสอบ หมายเหตุ: ตรงกันข้ามกับกลยุทธ์การตรวจสอบข้ามอื่น ๆ การบูตสแตรปจะช่วยให้ตัวอย่างบางอย่างเกิดขึ้นหลายครั้งในแต่ละการแยก อย่างไรก็ตามตัวอย่างที่เกิดขึ้นในการแยกรถไฟจะไม่เกิดขึ้นในการทดสอบแยกและในทางกลับกัน หากคุณต้องการให้แต่ละตัวอย่างเกิดขึ้นมากที่สุดคุณควรใช้การตรวจสอบความถูกต้องแบบไขว้ของ ShuffleSplit แทน