คำถามค่อนข้างคลุมเครือดังนั้นฉันจะสมมติว่าคุณต้องการเลือกการวัดประสิทธิภาพที่เหมาะสมเพื่อเปรียบเทียบรุ่นต่างๆ สำหรับภาพรวมที่ดีของความแตกต่างที่สำคัญระหว่างร็อคและประชาสัมพันธ์โค้งคุณสามารถดูกระดาษต่อไปนี้: ความสัมพันธ์ระหว่างความแม่นยำจำและเส้นโค้ง ROCโดยเดวิสและ Goadrich
หากต้องการอ้างอิง Davis และ Goadrich:
อย่างไรก็ตามเมื่อต้องรับมือกับชุดข้อมูลที่บิดเบือนอย่างมากเส้นโค้ง Precision-Recall (PR) จะให้ภาพที่มีข้อมูลประสิทธิภาพของอัลกอริทึมมากขึ้น
พล็อตกราฟ ROC FPR กับ TPR เพื่อให้ชัดเจนยิ่งขึ้น:
FPR=FPFP+TN,TPR=TPTP+FN.
recall=TPTP+FN=TPR,precision=TPTP+FP
Precision is directly influenced by class (im)balance since FP is affected, whereas TPR only depends on positives. This is why ROC curves do not capture such effects.
Precision-recall curves are better to highlight differences between models for highly imbalanced data sets. If you want to compare different models in imbalanced settings, area under the PR curve will likely exhibit larger differences than area under the ROC curve.
That said, ROC curves are much more common (even if they are less suited). Depending on your audience, ROC curves may be the lingua franca so using those is probably the safer choice. If one model completely dominates another in PR space (e.g. always have higher precision over the entire recall range), it will also dominate in ROC space. If the curves cross in either space they will also cross in the other. In other words, the main conclusions will be similar no matter which curve you use.
Shameless advertisement. As an additional example, you could have a look at one of my papers in which I report both ROC and PR curves in an imbalanced setting. Figure 3 contains ROC and PR curves for identical models, clearly showing the difference between the two. To compare area under the PR versus area under ROC you can compare tables 1-2 (AUPR) and tables 3-4 (AUROC) where you can see that AUPR shows much larger differences between individual models than AUROC. This emphasizes the suitability of PR curves once more.