การสร้างชุดข้อมูลที่ไม่สมดุล


11

ฉันต้องการให้แบบจำลองที่ผ่านการฝึกอบรมของฉันทดสอบบนชุดข้อมูลที่ไม่สมดุล มีอัลกอริทึมใดบ้างที่สามารถสร้างข้อมูลสังเคราะห์จากชุดข้อมูลที่มีข้อความสมดุล (สแปม / ไม่ใช่สแปม)


คุณสามารถสร้างความสมดุลให้กับข้อมูลใด ๆ ได้โดยเพียงแค่ยกตัวอย่างหนึ่งคลาส
2974951

คำตอบ:


8

ลองSMOTEซึ่งเป็นอัลกอริทึมที่ใช้สำหรับการสุ่มตัวอย่างมากเกินไป มันสร้างตัวอย่างสังเคราะห์จากชั้นเรียนที่คุณต้องการตัวอย่างเกิน

คุณสามารถใช้สิ่งนี้เพื่อสร้างจำนวนตัวอย่างใด ๆ ที่คุณต้องการ


1
SMOTE สามารถใช้ในการสุ่มตัวอย่างได้หรือไม่
Stuart Peterson

ทีนี้, คุณสามารถได้รับการสุ่มตัวอย่างของคลาส A โดย oversampling class notA ...
kjetil b halvorsen

3
@ StuartPeterson ไม่ SMOTE เป็นอัลกอริธึมการสุ่มตัวอย่างมากเกินไป แต่มีอัลกอริธึมการสุ่มตัวอย่างอื่น ๆ อีกมากมาย
Mary93
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.