ชุดคาเร็ตเป็นไลบรารี R ที่ยอดเยี่ยมสำหรับการสร้างแบบจำลองการเรียนรู้ของเครื่องหลายแบบและมีฟังก์ชั่นหลายอย่างสำหรับการสร้างแบบจำลองและการประเมินผล สำหรับการปรับพารามิเตอร์และการฝึกอบรมรูปแบบแพคเกจคาเร็ตมี 'repeatcv' เป็นหนึ่งในวิธีการ
แนวปฏิบัติที่ดีการปรับพารามิเตอร์อาจทำได้โดยใช้การตรวจสอบความถูกต้องแบบ K-fold แบบซ้อนซึ่งทำหน้าที่ดังต่อไปนี้:
- แบ่งการฝึกอบรมที่กำหนดไว้ในชุดย่อย 'K'
- ในการทำซ้ำแต่ละครั้งให้นำชุดย่อย 'K ลบ 1' สำหรับการฝึกอบรมแบบจำลองและเก็บชุดย่อย 1 ชุด (ชุด holdout) สำหรับการทดสอบแบบจำลอง
- เพิ่มเติมพาร์ติชันการฝึกอบรม 'K ลบ 1' ตั้งค่าเป็นชุดย่อย 'K' และใช้ชุดย่อย 'K ลบ 1' ใหม่และ 'ชุดการตรวจสอบความถูกต้อง' ซ้ำสำหรับการปรับพารามิเตอร์ (การค้นหากริด) พารามิเตอร์ที่ดีที่สุดที่ระบุไว้ในขั้นตอนนี้ใช้สำหรับทดสอบชุดที่มีการพักในขั้นตอนที่ 2
ในทางกลับกันฉันคิดว่าการตรวจสอบความถูกต้องข้าม K-fold ซ้ำอาจทำซ้ำขั้นตอนที่ 1 และ 2 ซ้ำหลายครั้งเราเลือกที่จะค้นหาความแปรปรวนของแบบจำลอง
อย่างไรก็ตามการใช้อัลกอริทึมในคู่มือคาเร็ตดูเหมือนว่าวิธีการ 'repeatcv' อาจทำการตรวจสอบความถูกต้องแบบซ้อนข้าม K-fold เช่นกันนอกเหนือจากการตรวจสอบความถูกต้องแบบไขว้ซ้ำ
คำถามของฉันคือ:
- ความเข้าใจของฉันเกี่ยวกับวิธี caret 'repeatcv' ถูกต้องหรือไม่?
- ถ้าไม่ใช่คุณช่วยยกตัวอย่างการใช้การตรวจสอบความถูกต้องแบบซ้อนข้าม K-fold ด้วยวิธี 'repeatcv' โดยใช้แพ็คเกจคาเร็ตได้หรือไม่?
แก้ไข:
มีการอธิบายและเปรียบเทียบกลยุทธ์การตรวจสอบข้ามที่แตกต่างกันในบทความวิธีการนี้
Krstajic D, Buturovic LJ, Leahy DE และโทมัส S : ข้อผิดพลาดที่รอการตรวจสอบเมื่อมีการเลือกและการประเมินการถดถอยและการจัดรูปแบบ วารสาร Cheminformatics 2014 6 (1): 10 ดอย: 10.1186 / 1758-2946-6-10
ฉันสนใจใน“ อัลกอริทึม 2: การตรวจสอบความถูกต้องแบบข้ามกลุ่มที่ซ้ำซ้อน”และ“ อัลกอริทึม 3: การตรวจสอบความถูกต้องข้ามการตรวจสอบกริดแบบค้นหาซ้ำสำหรับการเลือกตัวแปรและการปรับพารามิเตอร์”โดยใช้