ป่าสุ่มคือชุดของต้นไม้ตัดสินใจที่เกิดขึ้นจากการสุ่มเลือกคุณสมบัติบางอย่างเท่านั้นที่จะสร้างต้นไม้แต่ละต้นด้วย (และบางครั้งการรวบข้อมูลการฝึกอบรม) เห็นได้ชัดว่าพวกเขาเรียนรู้และพูดคุยได้ดี มีใครทำการสุ่มตัวอย่าง MCMC ของพื้นที่ต้นไม้การตัดสินใจหรือเปรียบเทียบกับป่าสุ่ม? ฉันรู้ว่ามันอาจมีราคาแพงกว่าการคำนวณ MCMC และบันทึกต้นไม้ตัวอย่างทั้งหมด แต่ฉันสนใจคุณสมบัติทางทฤษฎีของรุ่นนี้ไม่ใช่ค่าใช้จ่ายในการคำนวณ สิ่งที่ฉันหมายถึงคือสิ่งนี้:
- สร้างแผนผังการตัดสินใจแบบสุ่ม (มันอาจจะทำงานได้อย่างน่ากลัว)
- โอกาส Compute ของต้นไม้กับสิ่งที่ต้องการหรือบางทีอาจจะเพิ่มระยะP P R ฉันo R ( T R อีอี)
- เลือกขั้นตอนการสุ่มเพื่อเปลี่ยนต้นไม้และเลือกบนพื้นฐานของความน่าจะเป็นข้อมูล)
- ทุกขั้นตอน N บันทึกสำเนาของต้นไม้ปัจจุบัน
- กลับไปที่ 3 สำหรับขนาดใหญ่ N * M บางครั้ง
- ใช้ชุดต้นไม้ที่บันทึกไว้ของ M เพื่อทำนายผล
สิ่งนี้จะให้ประสิทธิภาพที่คล้ายกันกับป่าสุ่ม โปรดทราบว่าที่นี่เราไม่ทิ้งข้อมูลหรือฟีเจอร์ที่ดีในขั้นตอนใด ๆ ซึ่งแตกต่างจากฟอเรสต์แบบสุ่ม