แคเร็ตวิธีการสุ่มตัวอย่างอีกครั้ง


20

ฉันใช้ไลบรารีcaretใน R เพื่อทดสอบขั้นตอนการสร้างแบบจำลองต่างๆ

trainControlวัตถุช่วยให้หนึ่งเพื่อระบุวิธีการใหม่การสุ่มตัวอย่าง วิธีการที่อธิบายไว้ในเอกสารส่วน 2.3 และรวมถึง: boot, boot632, cv, LOOCV, LGOCV, และrepeatedcv oobถึงแม้ว่าสิ่งเหล่านี้บางอย่างจะอนุมานได้ง่าย แต่วิธีการเหล่านี้ไม่ได้มีการกำหนดไว้อย่างชัดเจน

อะไรคือขั้นตอนที่สอดคล้องกับวิธีการสุ่มตัวอย่างใหม่เหล่านี้?


ลิงก์เอกสารเสียหาย ใช้สิ่งนี้แทน
vikas

คำตอบ:


20

ตกลงนี่คือความพยายามของฉัน:

  • boot - bootstrap
  • boot632 - 0.632 bootstrap
  • พันธุ์ - การตรวจสอบข้ามอาจจะหมายถึงK-พับการตรวจสอบข้าม
  • LOOCV - การตรวจสอบความถูกต้องของการลาออกข้ามส่วนหรือที่เรียกว่า jacknife
  • LGOCV - การตรวจสอบความถูกต้องของการลาออกจากกลุ่ม, ตัวแปรของ LOOCV สำหรับข้อมูลลำดับชั้น
  • repeatcv - อาจเป็นการตรวจสอบความถูกต้องของการสุ่มตัวอย่างย่อยซ้ำ ๆเช่นการหารเพื่อฝึกอบรมและข้อมูลการทดสอบทำในลักษณะสุ่ม
  • OOB - หมายถึงการประมาณค่าออกจากถุงที่เสนอโดย Breimanซึ่งต่อไปจะเกี่ยวข้องกับการบูตรวม (ไฟล์ในลิงก์ไม่ใช่ไฟล์ ps แต่เป็นไฟล์ ps.Z เปลี่ยนชื่อแล้วลองเปิด)

1
ฉันเชื่อว่า LGOCV แยกการสุ่มระหว่างชุดการฝึกอบรมและชุดการตรวจสอบความถูกต้องซ้ำแล้วซ้ำอีกครั้ง ดังนั้นแทนที่จะเป็นกรณีปกติของการแยกข้อมูลระหว่างรถไฟและการหยุดพัก (สร้างแบบจำลองบนรถไฟและตรวจสอบการระงับ) หนึ่งครั้งกระบวนการนี้ซ้ำหลายครั้ง
B_Miner

3
ฉันยังเชื่อว่า repeatCV คือการตรวจสอบความถูกต้องข้ามแบบ k-fold ได้ทำหลายครั้ง
B_Miner

ยากที่จะเชื่อว่านี่ไม่ได้บันทึกไว้ที่ใดที่หนึ่ง
แอนดรู

4

การrepeatedcvตรวจสอบไขว้ซ้ำ 10 เท่าถูกต้องแน่นอนตามการนำเสนอของ Max Kuhn ชุดตัวอย่าง resampling เริ่มต้นคือ bootstrap

ไฟล์ที่ดีที่คุณสามารถดูวิธีการสุ่มตัวอย่างใหม่คือPredictive Modeling with R และ caret Package ( pdf ) Max แสดงสิ่งนี้ใน "useR! 2013"

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.