ใครช่วยอธิบายความแตกต่างระหว่าง RandomForestClassifier และ ExtraTreesClassifier ใน scikit ได้ ฉันใช้เวลาพอสมควรในการอ่านบทความ:
P. Geurts, D. Ernst. และ L. Wehenkel,“ Extremely randomized trees”, Machine Learning, 63 (1), 3-42, 2006
ดูเหมือนว่านี่คือความแตกต่างสำหรับ ET:
1) เมื่อเลือกตัวแปรแบบแยกตัวอย่างจะถูกดึงมาจากชุดการฝึกอบรมทั้งหมดแทนที่จะเป็นตัวอย่าง bootstrap ของชุดการฝึกอบรม
2) การแยกจะถูกเลือกโดยการสุ่มจากช่วงของค่าในตัวอย่างในแต่ละการแบ่ง
ผลจากสองสิ่งนี้คือ "ใบไม้" อีกมากมาย