เป็นวิธีที่ดีที่สุดในการจัดหมวดหมู่วิธีการที่ได้รับการพัฒนาเพื่อจัดการกับปัญหาระดับความไม่สมดุลคืออะไร?
นี้บทความแบ่งพวกเขาออกเป็น:
- การประมวลผลล่วงหน้า: รวมถึงการ oversampling, undersampling และ hybrid
- การเรียนรู้ที่มีความอ่อนไหวด้านต้นทุน: รวมถึงวิธีการโดยตรงและการเรียนรู้แบบ meta-learning
- เทคนิคของ Ensemble: ประกอบด้วยตระการตาที่ไวต่อราคาและการประมวลผลข้อมูลล่วงหน้าร่วมกับการเรียนรู้ทั้งมวล
การจำแนกประเภทที่สอง :
- การประมวลผลข้อมูลล่วงหน้า: รวมถึงการเปลี่ยนแปลงการกระจายและการถ่วงน้ำหนักพื้นที่ข้อมูล การเรียนรู้แบบชั้นเดียวถือเป็นการเปลี่ยนการกระจาย
- วิธีการเรียนรู้จุดประสงค์พิเศษ
- การคาดการณ์หลังการประมวลผล: รวมถึงวิธีการตามเกณฑ์และการประมวลผลภายหลังที่มีความอ่อนไหวด้านต้นทุน
- วิธีไฮบริด:
บทความที่สาม:
- วิธีการระดับข้อมูล
- วิธีการระดับอัลกอริทึม
- วิธีไฮบริด
การจำแนกประเภทสุดท้ายยังพิจารณาการปรับปรุงผลลัพธ์เป็นแนวทางอิสระ
ขอบคุณล่วงหน้า.
4
คำตอบสั้น ๆ : พวกเขาทั้งหมดนั้นดีที่สุดและทั้งหมดนั้นแย่ที่สุด! การจำแนกและการทำเหมืองข้อมูลโดยทั่วไปมีความอ่อนไหวต่อบริบทมาก ไม่มีขนาดที่เหมาะกับโซลูชันทั้งหมดในโดเมนนี้ โดยวิธีการที่ดีที่สุดในแง่ทั่วไปมักจะเป็นการรวมกันของการตัดสินใจที่ดีที่สุดในระดับที่แตกต่างจากการแยกคุณลักษณะเพื่อรูปแบบการประเมินผล
—
mok
@ โมกขอบคุณ คุณช่วยบอกให้ฉันทราบน้ำหนักชั้นเรียนในตัวจำแนกประเภทของ sklearn ได้เช่นการถดถอยโลจิสติกส์ถูกจัดเป็นหมวดหมู่ใด
—
ebrahimi
@ebrahimi ควรอยู่ในระดับอัลกอริธึมเนื่องจากมีการปรับเฉพาะน้ำหนักตามพจนานุกรมที่ส่งผ่านหรือคำนวณ (อนุมาน) ตามค่าของ y (คลาส) และข้อมูลยังคงไม่ถูกแตะต้อง
—
Sanjay Krishna
@SanjayKrishna ขอบคุณมาก ในกรณีของการจัดหมวดหมู่แรกมันตกอยู่ในการเรียนรู้ที่คุ้มค่าใช่มั้ย นอกจากนี้ในกรณีของอนุกรมวิธานที่สองก็จะแบ่งออกเป็นประเภทที่สามคือโพสต์การประมวลผลที่ไวต่อต้นทุน จริงป้ะ? คำตอบที่สองสำหรับเรื่องนี้: stackoverflow.com/questions/32492550/…ก็มีประโยชน์เช่นกัน
—
ebrahimi