บทบาทของพารามิเตอร์ n.minobsinnode ของ GBM ใน R [ปิด]


21

ฉันต้องการทราบว่าพารามิเตอร์n.minobsinnode มีความหมายอย่างไรในแพ็คเกจ GBM ฉันอ่านคู่มือ แต่ไม่ชัดเจนว่ามันทำอะไร ตัวเลขนั้นควรเล็กหรือใหญ่เพื่อปรับปรุงผลลัพธ์


9
"คำถามนี้ไม่น่าจะช่วยผู้เข้าชมในอนาคตได้" ฉันเป็นผู้เยี่ยมชมในอนาคตและฉันพบว่ามันมีประโยชน์
ดิ้นรน

1
ฉันก็พบว่ามันเป็นประโยชน์
oaxacamatt

คำตอบ:


25

ในแต่ละขั้นตอนของอัลกอริทึม GBM โครงสร้างการตัดสินใจใหม่จะถูกสร้างขึ้น คำถามเมื่อปลูกต้นไม้ตัดสินใจคือ 'จะหยุดเมื่อไหร่' สิ่งที่ไกลที่สุดที่คุณสามารถทำได้คือการแยกแต่ละโหนดจนกว่าจะมีเพียง 1 การสังเกตในแต่ละโหนดเทอร์มินัล สิ่งนี้จะสอดคล้องกับ n.minobsinnode = 1 อีกทางหนึ่งการแยกโหนดสามารถหยุดเมื่อสังเกตจำนวนหนึ่งอยู่ในแต่ละโหนด ค่าเริ่มต้นสำหรับแพ็คเกจ R GBM คือ 10

ค่าที่ดีที่สุดในการใช้คืออะไร? ขึ้นอยู่กับชุดข้อมูลและไม่ว่าคุณจะทำการจำแนกหรือถดถอย เนื่องจากการทำนายของต้นไม้แต่ละต้นถูกนำมาเป็นค่าเฉลี่ยของตัวแปรตามของอินพุตทั้งหมดในโหนดเทอร์มินัลค่า 1 อาจไม่ทำงานได้ดีสำหรับการถดถอย (!) แต่อาจเหมาะสำหรับการจำแนกประเภท

ค่าที่สูงกว่าหมายถึงต้นไม้ขนาดเล็กดังนั้นให้อัลกอริทึมทำงานเร็วขึ้นและใช้หน่วยความจำน้อยลง

โดยทั่วไปผลลัพธ์ไม่ได้อ่อนไหวต่อพารามิเตอร์นี้มากนักและเนื่องจากลักษณะที่สุ่มของประสิทธิภาพของ GBM อาจเป็นเรื่องยากที่จะระบุว่าค่าใดที่ 'ดีที่สุด' ความลึกของการปฏิสัมพันธ์การหดตัวและจำนวนต้นไม้จะมีความสำคัญมากกว่าโดยทั่วไป

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.