ฉันเพิ่งอ่านการสนทนานี้เสร็จแล้ว พวกเขายืนยันว่า PR AUC นั้นดีกว่า ROC AUC ในชุดข้อมูลที่ไม่สมดุล
ตัวอย่างเช่นเรามี 10 ตัวอย่างในชุดข้อมูลทดสอบ 9 ตัวอย่างเป็นค่าบวกและ 1 เป็นค่าลบ เรามีโมเดลที่น่ากลัวซึ่งทำนายทุกอย่างในเชิงบวก ดังนั้นเราจะมีการวัดที่ TP = 9, FP = 1, TN = 0, FN = 0
จากนั้นความแม่นยำ = 0.9, เรียกคืน = 1.0 ความแม่นยำและการเรียกคืนมีทั้งสูงมาก แต่เรามีลักษณนามไม่ดี
ในทางกลับกัน TPR = TP / (TP + FN) = 1.0, FPR = FP / (FP + TN) = 1.0 เนื่องจาก FPR นั้นสูงมากเราจึงสามารถระบุได้ว่านี่ไม่ใช่ตัวจําแนกที่ดี
เห็นได้ชัดว่า ROC ดีกว่า PR ในชุดข้อมูลที่ไม่สมดุล ใครสามารถอธิบายได้ว่าทำไม PR ถึงดีกว่า