ROC curves สำหรับชุดข้อมูลที่ไม่สมดุล


10

พิจารณาการป้อนข้อมูลเมทริกซ์และเอาท์พุทไบนารีYXy

วิธีทั่วไปในการวัดประสิทธิภาพของตัวจําแนกคือการใช้ ROC curves

ในพล็อต ROC เส้นทแยงมุมคือผลลัพธ์ที่จะได้รับจากตัวจําแนกแบบสุ่ม ในกรณีที่เอาต์พุตไม่สมดุลประสิทธิภาพของตัวจําแนกแบบสุ่มสามารถปรับปรุงได้โดยเลือกหรือมีความน่าจะเป็นต่างกันy01

ประสิทธิภาพของลักษณนามดังกล่าวสามารถแสดงในพล็อตกราฟ ROC ได้อย่างไร? ฉันคิดว่ามันควรเป็นเส้นตรงที่มีมุมต่างกันและไม่ใช่เส้นทแยงมุมอีกต่อไปใช่ไหม

ตัวอย่างเส้นโค้ง ROC


2
คุณอาจต้องการที่จะลองโค้งแม่นยำเรียกคืนแทน "ความแม่นยำจำพล็อตเพิ่มเติมข้อมูลกว่าพล็อตร็อคเมื่อประเมิน Binary ลักษณนามในชุดข้อมูลขาดดุล" ncbi.nlm.nih.gov/pmc/articles/PMC4349800มีโอกาสมากขึ้น เว็บไซต์ที่สามารถเข้าถึงได้สร้างขึ้นโดยผู้เขียนบทความ, classeval.wordpress.com/simulation-analysis/ …
zyxue

คำตอบ:


16

เส้นโค้ง ROC นั้นไม่ไวต่อความสมดุลของคลาส เส้นตรงที่คุณได้รับสำหรับลักษณนามแบบสุ่มตอนนี้เป็นผลมาจากการใช้ความน่าจะเป็นที่ต่างกันของการให้ผลบวก (0 นำคุณไปที่ (0, 0) และ 1 นำคุณไปที่ (1, 1) ด้วยช่วงใด ๆ

ไม่มีอะไรเปลี่ยนแปลงในการตั้งค่าที่ไม่สมดุล


1
ฉันคิดว่ามันมีประโยชน์ที่จะพิจารณาความหมายของพื้นที่ใต้เส้นโค้งเพื่อดูว่าทำไมเส้นทแยงมุมไม่เปลี่ยน AUC สามารถตีความได้ว่าเป็นความน่าจะเป็นที่ตัวอย่างบวกที่เลือกแบบสุ่มจะมีคะแนนสูงกว่าตัวอย่างเชิงลบที่เลือกแบบสุ่ม 1 . นี่ทำให้ฉันชัดเจนขึ้นว่าทำไมความไม่สมดุลในชั้นเรียนไม่ใช่ปัญหา
JBecker
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.