ฉันมีตัวจําแนกสองตัว
- A: เครือข่าย Bayesian ที่ไร้เดียงสา
- B: ต้นไม้ (เชื่อมต่อโดยลำพัง) เครือข่ายแบบเบย์
ในแง่ของความแม่นยำและมาตรการอื่น ๆ A ทำงานค่อนข้างแย่กว่า B. อย่างไรก็ตามเมื่อฉันใช้ R แพ็คเกจ ROCR และ AUC เพื่อทำการวิเคราะห์ ROC ปรากฎว่า AUC สำหรับ A สูงกว่า AUC สำหรับ B เหตุใดจึงเป็นเช่นนี้ เกิดขึ้น?
จริงบวก (tp), เท็จบวก (fp), ลบเท็จ (fn), ลบจริง (tn), ความไว (เซน), ความจำเพาะ (spec), ค่าพยากรณ์เชิงบวก (ppv), ค่าพยากรณ์ลบ (npv), และ ความแม่นยำ (acc) สำหรับ A และ B มีดังนี้
+------+---------+---------+
| | A | B |
+------+---------+---------+
| tp | 3601 | 769 |
| fp | 0 | 0 |
| fn | 6569 | 5918 |
| tn | 15655 | 19138 |
| sens | 0.35408 | 0.11500 |
| spec | 1.00000 | 1.00000 |
| ppv | 1.00000 | 1.00000 |
| npv | 0.70442 | 0.76381 |
| acc | 0.74563 | 0.77084 |
+------+---------+---------+
ด้วยข้อยกเว้นของความรู้สึกและความสัมพันธ์ (ข้อมูลจำเพาะและ ppv) บนระยะขอบ (ยกเว้น tp, fn, fn และ tn) ดูเหมือนว่า B จะทำงานได้ดีกว่า A
เมื่อฉันคำนวณ AUC สำหรับ sens (แกน y) เทียบกับ 1-spec (แกน x)
aucroc <- auc(roc(data$prediction,data$labels));
นี่คือการเปรียบเทียบ AUC
+----------------+---------+---------+
| | A | B |
+----------------+---------+---------+
| sens vs 1-spec | 0.77540 | 0.64590 |
| sens vs spec | 0.70770 | 0.61000 |
+----------------+---------+---------+
ดังนั้นนี่คือคำถามของฉัน:
- เหตุใด AUC สำหรับ A ดีกว่า B เมื่อ B "ดูเหมือน" ดีกว่า A เมื่อเทียบกับความแม่นยำ
- ดังนั้นฉันจะตัดสิน / เปรียบเทียบการจำแนกประเภทของ A และ B ได้อย่างไร? ฉันหมายถึงฉันใช้ค่า AUC หรือไม่ ฉันใช้ค่ามาตรฐานและถ้าเป็นเช่นนั้นทำไม
- นอกจากนี้เมื่อฉันใช้กฎการให้คะแนนที่เหมาะสมกับ A และ B B มีประสิทธิภาพเหนือกว่า A ในแง่ของการสูญเสียบันทึกการสูญเสียกำลังสองและการสูญเสียทรงกลม (p <0.001) น้ำหนักเหล่านี้มีผลต่อการตัดสินประสิทธิภาพการจำแนกประเภทอย่างไรเมื่อเทียบกับ AUC
- กราฟ ROC สำหรับ A ดูเรียบมาก (เป็นส่วนโค้ง) แต่กราฟ ROC สำหรับ B ดูเหมือนชุดของเส้นเชื่อมต่อ ทำไมนี้
ตามที่ร้องขอนี่คือแผนผังสำหรับโมเดล A
นี่คือแปลงสำหรับโมเดล B
นี่คือพล็อตฮิสโตแกรมของการแจกแจงความน่าจะเป็นสำหรับ A และ B (การแบ่งถูกตั้งไว้ที่ 20)
นี่คือพล็อตการกระจายของความน่าจะเป็นของ B กับ A