ฉันเป็นผู้เริ่มต้นในการเรียนรู้ของเครื่องจักรและฉันกำลังเผชิญกับสถานการณ์ ฉันกำลังทำงานเกี่ยวกับปัญหาการเสนอราคาแบบเรียลไทม์กับชุดข้อมูล IPinYou และฉันพยายามคาดคะเนการคลิก
อย่างที่คุณทราบชุดข้อมูลนั้นไม่สมดุลมาก: มีตัวอย่างเชิงลบประมาณ 1300 ตัวอย่าง (ไม่ใช่คลิก) สำหรับตัวอย่างที่เป็นบวก 1 รายการ (คลิก)
นี่คือสิ่งที่ฉันทำ:
- โหลดข้อมูล
- แบ่งชุดข้อมูลออกเป็น 3 ชุดข้อมูล: A = การฝึกอบรม (60%) B = การตรวจสอบความถูกต้อง (20%) C = การทดสอบ (20%)
- สำหรับแต่ละชุดข้อมูล (A, B, C) ให้ทำ under-sampling บนแต่ละคลาสลบเพื่อให้มีอัตราส่วน 5 (ตัวอย่างลบ 5 สำหรับตัวอย่างบวก 1 ตัวอย่าง) ให้ 3 ชุดข้อมูลใหม่ที่มีความสมดุลมากกว่า: A 'B' C '
จากนั้นฉันฝึกโมเดลของฉันด้วยชุดข้อมูล A 'และการถดถอยโลจิสติก
คำถามของฉันคือ:
ฉันต้องใช้ชุดข้อมูลใดในการตรวจสอบความถูกต้อง B หรือ B '
ฉันต้องใช้ชุดข้อมูลใดในการทดสอบ C หรือ C '
การวัดใดที่เกี่ยวข้องมากที่สุดในการประเมินโมเดลของฉัน F1Score ดูเหมือนจะเป็นตัวชี้วัดที่ใช้กันอย่างแพร่หลาย แต่ที่นี่เนื่องจากคลาสไม่สมดุลกัน (ถ้าฉันใช้ชุดข้อมูล B และ C) ความแม่นยำต่ำ (ต่ำกว่า 0.20) และ F1Score นั้นได้รับอิทธิพลอย่างมากจากการเรียกคืน / ความแม่นยำต่ำ นั่นจะแม่นยำยิ่งขึ้นถ้าใช้ aucPR หรือ aucROC
หากฉันต้องการพล็อตกราฟการเรียนรู้ฉันควรใช้การวัดใด (รู้ว่าข้อผิดพลาด% ไม่เกี่ยวข้องถ้าฉันใช้ชุดข้อมูล B 'สำหรับการตรวจสอบ)
ขอบคุณล่วงหน้าสำหรับเวลาของคุณ!
ความนับถือ.