ป่าสุ่มสร้างป่าสุ่มอย่างไร

20

ฉันไม่ใช่ผู้เชี่ยวชาญของป่าสุ่ม แต่ฉันเข้าใจชัดเจนว่าปัญหาสำคัญของป่าสุ่มคือการสร้างต้นไม้ (สุ่ม) คุณช่วยอธิบายฉันได้อย่างไรว่าต้นไม้สร้างขึ้นได้อย่างไร? (เช่นการกระจายที่ใช้สำหรับการสร้างต้นไม้คืออะไร)

ขอบคุณล่วงหน้า !

— โรบินกีร์ด
แหล่งที่มา

16

การใช้งานของ RF แตกต่างกันเล็กน้อย ฉันรู้ว่า Salford ระบบการดำเนินงานที่เป็นกรรมสิทธิ์ที่ควรจะเป็นดีกว่าหนึ่งวานิลลาในคำอธิบายของอาของอัลกอริทึมที่อยู่ในการสอนภาษาอังกฤษโดยฟรีดแมน-Hastie-Tibshirani 2 เอ็ด, พิมพ์ครั้งที่ ทั้งบท (วันที่ 15) อุทิศให้กับ RF และฉันคิดว่ามันชัดเจนกว่าต้นฉบับมาก ขั้นตอนวิธีการก่อสร้างต้นไม้นั้นมีรายละเอียดอยู่ที่ p.588; ไม่จำเป็นสำหรับฉันที่จะทำซ้ำที่นี่เนื่องจากหนังสือเล่มนี้มีให้บริการออนไลน์

— Gappy
แหล่งที่มา

ขอบคุณมากสำหรับคำตอบของคุณ! ฉันได้อ่านหนังสือเล่มนี้ตั้งแต่หน้าแรกไปจนถึงหน้าสุดท้าย แต่ฉันคิดว่ามันเป็นรุ่นที่ 1 ... ฉันไม่รู้ว่ามันออนไลน์

— robin girard

19

แนวคิดหลักคือขั้นตอนการบรรจุถุงไม่ใช่การสุ่มต้นไม้ ในรายละเอียดต้นไม้แต่ละต้นถูกสร้างขึ้นบนตัวอย่างของวัตถุที่วาดด้วยการแทนที่จากชุดเดิม ดังนั้นต้นไม้แต่ละต้นมีวัตถุบางอย่างที่มันไม่ได้เห็นซึ่งเป็นสิ่งที่ทำให้ทั้งชุดต่างกันมากขึ้นและทำให้ดีขึ้นใน generalizing

ยิ่งไปกว่านั้นต้นไม้กำลังถูกทำให้อ่อนลงในลักษณะที่แต่ละตัวแยกmtryจะพิจารณาเฉพาะคุณลักษณะM (หรือ) แบบสุ่มเท่านั้น M มักเป็นรากที่สองของจำนวนแอตทริบิวต์ในชุด สิ่งนี้ทำให้มั่นใจได้ว่าต้นไม้จะมีต้นไม้น้อยเกินไปเนื่องจากไม่ได้ถูกตัดแต่ง คุณสามารถค้นหารายละเอียดเพิ่มเติมได้ที่นี่

ในอีกทางหนึ่งมีตัวแปรของ RF ที่เรียกว่า Extreme Random Forest ซึ่งต้นไม้ถูกสร้างขึ้นในลักษณะสุ่ม (ไม่มีการเพิ่มประสิทธิภาพของการแยก) - ปรึกษาฉันคิดว่าการอ้างอิงนี้

— Amelio Vazquez-Reina
แหล่งที่มา

ขออภัยฉันไม่เข้าใจคำตอบของคุณจริงๆ คุณหมายถึงอะไร "รายละเอียดต้นไม้แต่ละต้นสร้างขึ้นจากตัวอย่างของวัตถุที่ดึงมาจากชุดเดิม" คุณช่วยเพิ่มความแม่นยำในการหารายละเอียด "ที่นี่" ได้ไหม

— robin girard

1

นี่คือวิธีการบรรจุถุงทำงาน ตรวจสอบen.wikipedia.org/wiki/Bootstrap_aggregating นี่คือลิงค์ (แทบจะมองไม่เห็นในชุดรูปแบบที่ฉันยอมรับ) เพื่อการอ้างอิง RF โดยละเอียด