ฉันต้องการทราบว่าพารามิเตอร์n.minobsinnode มีความหมายอย่างไรในแพ็คเกจ GBM ฉันอ่านคู่มือ แต่ไม่ชัดเจนว่ามันทำอะไร ตัวเลขนั้นควรเล็กหรือใหญ่เพื่อปรับปรุงผลลัพธ์
ฉันต้องการทราบว่าพารามิเตอร์n.minobsinnode มีความหมายอย่างไรในแพ็คเกจ GBM ฉันอ่านคู่มือ แต่ไม่ชัดเจนว่ามันทำอะไร ตัวเลขนั้นควรเล็กหรือใหญ่เพื่อปรับปรุงผลลัพธ์
คำตอบ:
ในแต่ละขั้นตอนของอัลกอริทึม GBM โครงสร้างการตัดสินใจใหม่จะถูกสร้างขึ้น คำถามเมื่อปลูกต้นไม้ตัดสินใจคือ 'จะหยุดเมื่อไหร่' สิ่งที่ไกลที่สุดที่คุณสามารถทำได้คือการแยกแต่ละโหนดจนกว่าจะมีเพียง 1 การสังเกตในแต่ละโหนดเทอร์มินัล สิ่งนี้จะสอดคล้องกับ n.minobsinnode = 1 อีกทางหนึ่งการแยกโหนดสามารถหยุดเมื่อสังเกตจำนวนหนึ่งอยู่ในแต่ละโหนด ค่าเริ่มต้นสำหรับแพ็คเกจ R GBM คือ 10
ค่าที่ดีที่สุดในการใช้คืออะไร? ขึ้นอยู่กับชุดข้อมูลและไม่ว่าคุณจะทำการจำแนกหรือถดถอย เนื่องจากการทำนายของต้นไม้แต่ละต้นถูกนำมาเป็นค่าเฉลี่ยของตัวแปรตามของอินพุตทั้งหมดในโหนดเทอร์มินัลค่า 1 อาจไม่ทำงานได้ดีสำหรับการถดถอย (!) แต่อาจเหมาะสำหรับการจำแนกประเภท
ค่าที่สูงกว่าหมายถึงต้นไม้ขนาดเล็กดังนั้นให้อัลกอริทึมทำงานเร็วขึ้นและใช้หน่วยความจำน้อยลง
โดยทั่วไปผลลัพธ์ไม่ได้อ่อนไหวต่อพารามิเตอร์นี้มากนักและเนื่องจากลักษณะที่สุ่มของประสิทธิภาพของ GBM อาจเป็นเรื่องยากที่จะระบุว่าค่าใดที่ 'ดีที่สุด' ความลึกของการปฏิสัมพันธ์การหดตัวและจำนวนต้นไม้จะมีความสำคัญมากกว่าโดยทั่วไป