ฟอเรสต์แบบสุ่มออนไลน์โดยเพิ่มต้นไม้การตัดสินใจเดียว


13

Random Forest (RF) ถูกสร้างโดยกลุ่ม Decision Trees's (DT) โดยการใช้การบรรจุถุง DT แต่ละตัวจะได้รับการฝึกอบรมในชุดข้อมูลที่แตกต่างกัน ดังนั้นมีวิธีใดบ้างที่จะใช้ฟอเรสต์แบบสุ่มออนไลน์โดยเพิ่มการตัดสินใจข้อมูลเพิ่มเติมใหม่?

ตัวอย่างเช่นเรามีตัวอย่าง 10K และฝึกอบรม 10 DT จากนั้นเราจะได้รับ 1K ตัวอย่างและแทนที่จะฝึกอบรม RF แบบเต็มอีกครั้งเราเพิ่ม DT ใหม่ การทำนายเสร็จสิ้นในตอนนี้โดยค่าเฉลี่ยของเบย์จาก 10 + 1 DT

นอกจากนี้หากเราเก็บข้อมูลก่อนหน้านี้ทั้งหมด DT ใหม่สามารถได้รับการฝึกอบรมเป็นหลักในข้อมูลใหม่ที่ความน่าจะเป็นของการเลือกตัวอย่างนั้นจะมีน้ำหนักขึ้นอยู่กับจำนวนครั้งที่ได้รับ

คำตอบ:


8

มีบทความล่าสุดเกี่ยวกับเรื่องนี้ ( ป่าสุ่มแบบออนไลน์ ) ซึ่งมาจากการมองเห็นของคอมพิวเตอร์ นี่คือการนำไปใช้และงานนำเสนอ: ออนไลน์ฟอเรสต์แบบสุ่มใน 10 นาที


การใช้งานที่คุณกล่าวถึงเป็นไปตามกลยุทธ์การปลูกต้นไม้เช่นป่า Mondrian ( arxiv.org/abs/1406.2673 ) ดังนั้นจำนวนของต้นไม้คงที่ในขณะที่จำนวนของการแยกจะเพิ่มขึ้น คำถามของฉันมุ่งเน้นไปที่การเพิ่มจำนวนต้นไม้สำหรับตัวอย่างใหม่ในขณะที่ไม่มีการแตะต้องต้นไม้ที่ผ่านการฝึกอบรมมาก่อน
tashuhka

1
เช่นนี้ ? คุณไม่ต้องการวางต้นไม้หากเหมาะสมหรือไม่
Emre

ขอขอบคุณ. นี่คล้ายกับสิ่งที่ฉันกำลังมองหา ในกรณีนี้ใช้ RF สำหรับการเลือกคุณสมบัติของสัญญาณแปรเวลา อย่างไรก็ตามการใช้งานเฉพาะและความถูกต้องของวิธีการค่อนข้างชัดเจนคุณรู้หรือไม่ว่าพวกเขาเผยแพร่สิ่งใด (Google ไม่ได้ช่วย)
tashuhka


ขอบคุณสำหรับลิงค์! ฉันเห็นได้ว่าพวกเขาปรับปรุงต้นไม้ก่อนหน้านี้ทั้งหมดโดยใช้กลยุทธ์การปลูกต้นไม้และฉันสนใจที่จะสร้าง DT ใหม่ด้วยข้อมูลใหม่ในขณะที่ยังคงรักษาต้นไม้เก่าไว้
tashuhka
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.