เป็นไปได้หรือไม่ที่จะควบคุมค่าใช้จ่ายในการจำแนกประเภทใน R แพ็คเกจแบบสุ่มป่าไม้ ?
ในงานของฉันเองเชิงลบเท็จ (เช่นหายไปในข้อผิดพลาดที่บุคคลอาจมีโรค) มีราคาแพงกว่าบวกเท็จ แพ็คเกจrpartช่วยให้ผู้ใช้สามารถควบคุมค่าใช้จ่ายในการจำแนกประเภทได้โดยการระบุเมทริกซ์การสูญเสียไปยังการจัดประเภทน้ำหนักที่แตกต่างกัน มีอะไรที่คล้ายกันเกิดขึ้นเพื่อrandomForest
อะไร? ตัวอย่างเช่นฉันควรใช้classwt
ตัวเลือกในการควบคุมเกณฑ์ของ Gini หรือไม่
classwt
: ใช่ฉันพบว่าในทางปฏิบัติและสอดคล้องกับผู้ใช้รายอื่นผลลัพธ์ไม่เป็นไปตามที่คาดไว้ (iii)cutoff
: ฉันไม่ชัดเจนเกี่ยวกับวิธีการใช้ประโยชน์cutoff
ในกรณีนี้และฉันยินดีรับคำแนะนำเพิ่มเติม