% IncMSE เป็นมาตรการที่แข็งแกร่งและให้ข้อมูลมากที่สุด มันคือการเพิ่มขึ้นของ mse ของการคาดการณ์ (ประมาณกับ out-of-bag-CV) ซึ่งเป็นผลมาจากตัวแปร j ที่ได้รับอนุญาต (ค่าสับแบบสุ่ม)
- ปลูกป่าถดถอย คำนวณ OOB-mse ตั้งชื่อ mse0 นี้
- สำหรับ 1 ถึง j var: ค่า permute ของคอลัมน์ j จากนั้นทำนายและคำนวณ OOB-mse (j)
- % IncMSE ของ j'th คือ (mse (j) -mse0) / mse0 * 100%
จำนวนที่สูงขึ้นสำคัญยิ่ง
IncNodePurity เกี่ยวข้องกับฟังก์ชั่นการสูญเสียซึ่งโดยการเลือกแยกที่ดีที่สุด ฟังก์ชันการสูญเสียคือ mse สำหรับการถดถอยและ gini-impurity สำหรับการจำแนกประเภท ตัวแปรที่มีประโยชน์มากขึ้นจะเพิ่มความบริสุทธิ์ของโหนดให้สูงขึ้นนั่นคือการหาตัวแยกซึ่งมี 'ความแปรปรวน' ระหว่างโหนดสูงและ 'ความแปรปรวน' ของโหนดภายในขนาดเล็ก IncNodePurity นั้นมีความลำเอียงและควรใช้เฉพาะเมื่อเวลาคำนวณพิเศษของการคำนวณ% IncmsE นั้นไม่สามารถยอมรับได้ เนื่องจากใช้เวลาเพิ่มประมาณ 5-25% ในการคำนวณ% IncmsE สิ่งนี้แทบจะไม่เกิดขึ้นเลย
คำถามและคำตอบที่คล้ายกัน