คำตอบข้างต้นเป็นสิ่งที่ดี
แต่ประเด็นที่ฉันต้องการชี้ให้เห็นก็คือ AUC (Area under ROC) มีปัญหาโดยเฉพาะข้อมูลที่ไม่สมดุล (เรียกว่าเบ้อย่างมาก:มีขนาดใหญ่) สถานการณ์ประเภทนี้พบได้บ่อยในการตรวจจับการกระทำการตรวจจับการทุจริตการทำนายการล้มละลาย นั่นคือตัวอย่างเชิงบวกที่คุณสนใจมีอัตราการเกิดค่อนข้างต่ำSk e w = n e gทีฉันวีอีe x a m p l e sp o s i t i v ee x a m p l e s
ด้วยข้อมูลที่ไม่สมดุลทำให้ AUC ยังคงให้คุณค่าที่กว้างขวางประมาณ 0.8 อย่างไรก็ตามมันค่อนข้างสูงเนื่องจาก FP ขนาดใหญ่แทนที่จะเป็น TP ขนาดใหญ่ (ค่าบวกจริง)
เช่นตัวอย่างด้านล่าง
TP=155, FN=182
FP=84049, TN=34088
ดังนั้นเมื่อคุณใช้ AUC เพื่อวัดประสิทธิภาพของตัวจําแนกปัญหาคือการเพิ่ม AUC ไม่ได้สะท้อนตัวจําแนกที่ดีขึ้น มันเป็นผลข้างเคียงของตัวอย่างเชิงลบมากเกินไป คุณสามารถลองชุดข้อมูลของคุณได้
กระดาษหันหน้าไปทางข้อเสนอแนะข้อมูลที่ไม่สมดุลสำหรับการใช้งานของตัวชี้วัดประสิทธิภาพที่พบ "ในขณะที่ ROC ไม่ได้รับผลกระทบจากความเบ้โค้งที่จำได้แม่นยำชี้ให้เห็นว่า ROC อาจปกปิดประสิทธิภาพในบางกรณี" การค้นหาตัวชี้วัดประสิทธิภาพที่ดียังคงเป็นคำถามเปิด คะแนน F1 ทั่วไปอาจช่วยให้
Fβ= ( 1 + β2) ⋅ p r e c i s i o n ⋅ r e c a l l( β2⋅ p r e c i s i o n ) + r e c a l l
โดยที่มีความสำคัญอย่างยิ่งของความแม่นยำเมื่อเปรียบเทียบกับการเรียกคืนβ
จากนั้นคำแนะนำของฉันสำหรับข้อมูลที่ไม่สมดุลนั้นคล้ายกับโพสต์นี้ นอกจากนี้คุณยังสามารถลองตาราง decile ซึ่งสามารถสร้างได้โดยค้นหา "Two-by-Two Classification และ Decile Tables" ในขณะเดียวกันฉันกำลังศึกษาเกี่ยวกับปัญหานี้และจะทำให้ดีขึ้น