XGBoost สามารถจัดการข้อมูลที่ขาดหายไปในขั้นตอนการพยากรณ์


12

เมื่อเร็ว ๆ นี้ฉันได้ตรวจสอบอัลกอริทึม XGBoost และฉันสังเกตเห็นว่าอัลกอริทึมนี้สามารถจัดการข้อมูลที่ขาดหายไป (โดยไม่ต้องใส่ข้อมูล) ในขั้นตอนการฝึกอบรม ฉันสงสัยว่า XGboost สามารถจัดการข้อมูลที่หายไป (โดยไม่ต้องใส่ข้อมูล) เมื่อใช้สำหรับการคาดการณ์การสังเกตใหม่หรือมีความจำเป็นในการใส่ข้อมูลที่ขาดหายไป

ขอบคุณล่วงหน้า.

คำตอบ:


14

xgboost ตัดสินใจ ณ เวลาการฝึกอบรมว่าค่าที่หายไปเข้าสู่โหนดด้านขวาหรือด้านซ้าย มันเลือกที่จะลดการสูญเสีย หากไม่มีค่าที่ขาดหายไปในเวลาฝึกอบรมจะมีค่าเริ่มต้นให้ส่งการพลาดใหม่ไปยังโหนดที่ถูกต้อง

หากมีสัญญาณในการกระจายการพลาดของคุณนี่คือสิ่งที่เหมาะสมกับโมเดล

ระวังถ้าข้อมูลการให้คะแนนของคุณมีค่าขาดหายไปนั้นแตกต่างจากข้อมูลการฝึกอบรมของคุณ การจัดการที่ขาดหายไปของ xgboost สะดวก แต่ไม่ได้ป้องกันการปิดบัง

ที่มา: คำตอบนี้

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.