AUC ไม่ได้เปรียบเทียบชั้นเรียนจริงเทียบกับที่คาดการณ์ไว้ มันไม่ได้ดูที่คลาสที่ถูกทำนาย แต่คะแนนการทำนายหรือความน่าจะเป็น คุณสามารถทำนายผลการเรียนได้โดยใช้การตัดคะแนนนี้ตัวอย่างทุกตัวอย่างที่ได้คะแนนต่ำกว่า 0.5 จะถูกจัดประเภทเป็นลบ แต่ร็อคมาก่อนที่จะเกิดขึ้น มันทำงานร่วมกับคะแนน / ระดับความน่าจะเป็น
ใช้คะแนนเหล่านี้และเรียงลำดับตัวอย่างทั้งหมดตามคะแนนนั้น ตอนนี้เมื่อใดก็ตามที่คุณพบตัวอย่างที่เป็นบวก ROC-curve จะเพิ่มขึ้น (ตามแนวแกน y) เมื่อใดก็ตามที่คุณพบตัวอย่างเชิงลบคุณจะย้ายไปทางขวา (ตามแนวแกน x) หากคะแนนนั้นแตกต่างกันสำหรับทั้งสองคลาสตัวอย่างบวกจะมาก่อน (ปกติ) นั่นหมายความว่าคุณทำตามขั้นตอนได้มากกว่าทางด้านขวา ยิ่งกว่านั้นรายการตัวอย่างเชิงลบจะมาดังนั้นคุณจึงย้ายไปทางซ้าย เมื่อคุณผ่านรายการตัวอย่างทั้งหมดคุณจะไปถึงพิกัด (1,1) ซึ่งสอดคล้องกับ 100% ของบวกและ 100% ของตัวอย่างลบ
หากคะแนนแยกค่าบวกออกจากตัวอย่างลบอย่างสมบูรณ์คุณจะเลื่อนจาก (x = 0, y = 0) ไปที่ (1,0) จากนั้นไปที่ (1, 1) ดังนั้นพื้นที่ใต้เส้นโค้งคือ 1
หากคะแนนของคุณมีการกระจายตัวแบบเดียวกันสำหรับตัวอย่างบวกและลบความน่าจะเป็นที่จะหาตัวอย่างบวกหรือลบในรายการที่เรียงลำดับมีค่าเท่ากันดังนั้นความน่าจะเป็นที่จะเลื่อนขึ้นหรือซ้ายใน ROC-curve มีค่าเท่ากัน นั่นคือสาเหตุที่คุณเคลื่อนที่ไปตามแนวทแยงมุมเนื่องจากคุณต้องเลื่อนไปทางซ้ายและขึ้นและไปทางซ้ายเรื่อย ๆ ... ซึ่งให้ค่า AROC ประมาณ 0.5
ในกรณีของชุดข้อมูลที่ไม่สมดุลขั้นตอนต่างกัน ดังนั้นคุณทำขั้นตอนเล็ก ๆ ทางซ้าย (ถ้าคุณมีตัวอย่างเชิงลบมากขึ้น) นั่นคือเหตุผลที่คะแนนมากหรือน้อยขึ้นอยู่กับความไม่สมดุล
ด้วยเส้นโค้ง ROC คุณสามารถเห็นภาพว่าตัวอย่างของคุณถูกแยกออกจากกันอย่างไรและพื้นที่ใต้เส้นโค้งอาจเป็นตัวชี้วัดที่ดีมากในการวัดประสิทธิภาพของอัลกอริทึมการจำแนกแบบไบนารีหรือตัวแปรใด ๆ ที่อาจใช้ในการแยกชั้นเรียน
รูปภาพแสดงการแจกแจงแบบเดียวกันกับขนาดตัวอย่างที่แตกต่างกัน พื้นที่สีดำแสดงตำแหน่งที่คาดว่า ROC-curves ของการสุ่มผสมของตัวอย่างบวกและลบจะถูกคาดหวัง