ฟอเรสต์แบบสุ่มนั้นจะเริ่มต้นการสุ่มตัวอย่างใหม่และฝึกการตัดสินใจต้นไม้บนตัวอย่างดังนั้นคำตอบสำหรับคำถามของคุณจำเป็นต้องพูดถึงสองข้อนั้น
บูต resamplingคือไม่ได้แก้สำหรับตัวอย่างขนาดเล็ก หากคุณมีการสังเกตเพียงยี่สิบสี่ครั้งในชุดข้อมูลของคุณตัวอย่างแต่ละตัวอย่างที่ถูกแทนที่ด้วยข้อมูลนี้จะประกอบด้วยค่าที่แตกต่างกันไม่เกินยี่สิบสี่ค่า การสับเคสและการไม่วาดภาพบางส่วนจะไม่เปลี่ยนความสามารถของคุณในการเรียนรู้อะไรใหม่เกี่ยวกับการแจกแจงพื้นฐาน ดังนั้นตัวอย่างเล็ก ๆเป็นปัญหาสำหรับ bootstrap
ต้นไม้การตัดสินใจได้รับการฝึกฝนโดยการแยกข้อมูลตามตัวแปรตัวทำนายล่วงหน้าทีละหนึ่งตัวแปรเพื่อค้นหาชุดย่อยที่มีอำนาจในการเลือกปฏิบัติมากที่สุด หากคุณมีเพียงยี่สิบสี่กรณีให้พูดว่าถ้าคุณโชคดีและการแบ่งทั้งหมดมีขนาดเท่ากันถ้าคุณแยกสองกลุ่มคุณจะจบลงด้วยสี่กลุ่มหกกรณีพร้อมต้นไม้แยกกับกลุ่มแปดสามกลุ่ม หากคุณคำนวณค่าเฉลี่ยตามเงื่อนไขในตัวอย่าง (เพื่อทำนายค่าอย่างต่อเนื่องในต้นไม้ถดถอยหรือความน่าจะเป็นตามเงื่อนไขในต้นไม้ตัดสินใจ) คุณจะใช้ข้อสรุปของคุณเฉพาะในสองสามกรณีเหล่านั้น! ตัวอย่างย่อยที่คุณจะใช้ในการตัดสินใจจะน้อยกว่าข้อมูลต้นฉบับของคุณ
กับกลุ่มตัวอย่างขนาดเล็กก็มักจะฉลาดที่จะใช้วิธีการง่ายๆ ยิ่งไปกว่านั้นคุณสามารถติดตามตัวอย่างขนาดเล็กโดยใช้นักบวชที่มีข้อมูลในการตั้งค่าแบบเบย์ (ถ้าคุณมีความรู้นอกเรื่องข้อมูลที่สมเหตุสมผลเกี่ยวกับปัญหา) ดังนั้นคุณสามารถลองใช้แบบจำลองแบบเบส์ที่สร้างขึ้นเองได้