อะไรคือวิธีที่อัลกอริทึมการเรียนรู้ต้นไม้ตัดสินใจใช้เพื่อจัดการกับค่าที่หายไป
พวกเขาเพียงแค่เต็มช่องในการใช้ค่าที่เรียกว่าหายไป?
ขอบคุณ
อะไรคือวิธีที่อัลกอริทึมการเรียนรู้ต้นไม้ตัดสินใจใช้เพื่อจัดการกับค่าที่หายไป
พวกเขาเพียงแค่เต็มช่องในการใช้ค่าที่เรียกว่าหายไป?
ขอบคุณ
คำตอบ:
มีหลายวิธีที่ใช้ในต้นไม้ตัดสินใจ เพียงแค่ละเว้นค่าที่หายไป (เช่น ID3 และอัลกอริทึมเก่าอื่น ๆ ) หรือรักษาค่าที่หายไปเป็นหมวดหมู่อื่น (ในกรณีที่มีคุณสมบัติเล็กน้อย) ไม่ใช่การจัดการค่าที่หายไปจริง อย่างไรก็ตามวิธีการเหล่านั้นถูกนำมาใช้ในช่วงแรกของการพัฒนาต้นไม้ตัดสินใจ
วิธีการจัดการที่แท้จริงกับข้อมูลที่หายไปไม่ได้ใช้จุดข้อมูลที่มีค่าที่ขาดหายไปในการประเมินการแยก อย่างไรก็ตามเมื่อโหนดลูกถูกสร้างและฝึกฝนอินสแตนซ์เหล่านั้นจะถูกแจกจ่ายอย่างใด
ฉันรู้เกี่ยวกับวิธีการต่อไปนี้เพื่อแจกจ่ายอินสแตนซ์ค่าที่หายไปไปยังโหนดลูก: