ฉันต้องการใช้ Support Vector Machines (SVMs) ในชุดข้อมูลของฉัน ก่อนที่ฉันจะพยายามแก้ปัญหาฉันได้รับคำเตือนว่า SVM ไม่ทำงานได้ดีกับข้อมูลที่ไม่สมดุลอย่างยิ่ง ในกรณีของฉันฉันสามารถมีได้มากถึง 95-98% 0 และ 2-5% 1
ฉันพยายามค้นหาทรัพยากรที่พูดคุยเกี่ยวกับการใช้ SVM ในข้อมูลที่กระจัดกระจาย / ไม่สมดุล แต่สิ่งที่ฉันพบคือ 'sparseSVMs' (ซึ่งใช้เวกเตอร์สนับสนุนจำนวนเล็กน้อย)
ฉันหวังว่าบางคนสามารถอธิบายสั้น ๆ :
- SVM คาดว่าจะทำอย่างไรกับชุดข้อมูลดังกล่าว
- ซึ่งหากมีการปรับเปลี่ยนจะต้องทำกับอัลกอริทึม SVM
- แหล่งข้อมูล / เอกสารใดที่กล่าวถึงเรื่องนี้