ฉันไม่ใช่ผู้เชี่ยวชาญของป่าสุ่ม แต่ฉันเข้าใจชัดเจนว่าปัญหาสำคัญของป่าสุ่มคือการสร้างต้นไม้ (สุ่ม) คุณช่วยอธิบายฉันได้อย่างไรว่าต้นไม้สร้างขึ้นได้อย่างไร? (เช่นการกระจายที่ใช้สำหรับการสร้างต้นไม้คืออะไร)
ขอบคุณล่วงหน้า !
ฉันไม่ใช่ผู้เชี่ยวชาญของป่าสุ่ม แต่ฉันเข้าใจชัดเจนว่าปัญหาสำคัญของป่าสุ่มคือการสร้างต้นไม้ (สุ่ม) คุณช่วยอธิบายฉันได้อย่างไรว่าต้นไม้สร้างขึ้นได้อย่างไร? (เช่นการกระจายที่ใช้สำหรับการสร้างต้นไม้คืออะไร)
ขอบคุณล่วงหน้า !
คำตอบ:
การใช้งานของ RF แตกต่างกันเล็กน้อย ฉันรู้ว่า Salford ระบบการดำเนินงานที่เป็นกรรมสิทธิ์ที่ควรจะเป็นดีกว่าหนึ่งวานิลลาในคำอธิบายของอาของอัลกอริทึมที่อยู่ในการสอนภาษาอังกฤษโดยฟรีดแมน-Hastie-Tibshirani 2 เอ็ด, พิมพ์ครั้งที่ ทั้งบท (วันที่ 15) อุทิศให้กับ RF และฉันคิดว่ามันชัดเจนกว่าต้นฉบับมาก ขั้นตอนวิธีการก่อสร้างต้นไม้นั้นมีรายละเอียดอยู่ที่ p.588; ไม่จำเป็นสำหรับฉันที่จะทำซ้ำที่นี่เนื่องจากหนังสือเล่มนี้มีให้บริการออนไลน์
แนวคิดหลักคือขั้นตอนการบรรจุถุงไม่ใช่การสุ่มต้นไม้ ในรายละเอียดต้นไม้แต่ละต้นถูกสร้างขึ้นบนตัวอย่างของวัตถุที่วาดด้วยการแทนที่จากชุดเดิม ดังนั้นต้นไม้แต่ละต้นมีวัตถุบางอย่างที่มันไม่ได้เห็นซึ่งเป็นสิ่งที่ทำให้ทั้งชุดต่างกันมากขึ้นและทำให้ดีขึ้นใน generalizing
ยิ่งไปกว่านั้นต้นไม้กำลังถูกทำให้อ่อนลงในลักษณะที่แต่ละตัวแยกmtry
จะพิจารณาเฉพาะคุณลักษณะM (หรือ) แบบสุ่มเท่านั้น M มักเป็นรากที่สองของจำนวนแอตทริบิวต์ในชุด สิ่งนี้ทำให้มั่นใจได้ว่าต้นไม้จะมีต้นไม้น้อยเกินไปเนื่องจากไม่ได้ถูกตัดแต่ง คุณสามารถค้นหารายละเอียดเพิ่มเติมได้ที่นี่
ในอีกทางหนึ่งมีตัวแปรของ RF ที่เรียกว่า Extreme Random Forest ซึ่งต้นไม้ถูกสร้างขึ้นในลักษณะสุ่ม (ไม่มีการเพิ่มประสิทธิภาพของการแยก) - ปรึกษาฉันคิดว่าการอ้างอิงนี้