ในขณะที่การวัดสถิติทั้งสองมีแนวโน้มที่จะมีความสัมพันธ์กัน แต่พวกเขาวัดคุณภาพที่แตกต่างของตัวจําแนก
AUROC
พื้นที่ใต้เส้นโค้ง (AUC) เท่ากับความน่าจะเป็นที่ตัวจําแนกจะจัดอันดับอินสแตนซ์บวกที่เลือกแบบสุ่มที่สูงกว่าตัวอย่างเชิงลบที่เลือกแบบสุ่ม มันวัดทักษะตัวจําแนกในการจัดอันดับชุดรูปแบบตามระดับที่พวกเขาอยู่ในระดับบวก แต่ไม่ได้กำหนดรูปแบบให้กับชั้นเรียนจริง
ความแม่นยำโดยรวมยังขึ้นอยู่กับความสามารถของลักษณนามในการจัดอันดับรูปแบบ แต่ยังขึ้นอยู่กับความสามารถในการเลือกขีด จำกัด ในการจัดอันดับที่ใช้กำหนดรูปแบบให้กับคลาสบวกหากสูงกว่าขีด จำกัด และระดับลบหากต่ำกว่า
ดังนั้นตัวจําแนกที่มีสถิติ AUROC ที่สูงกว่า (ทุกสิ่งเท่ากัน) น่าจะมีความแม่นยำโดยรวมที่สูงขึ้นเมื่อการจัดอันดับของรูปแบบ (ซึ่งมาตรการ AUROC) เป็นประโยชน์ต่อทั้ง AUROC และความแม่นยำโดยรวม อย่างไรก็ตามหากตัวจําแนกหนึ่งจัดอันดับรูปแบบดี แต่เลือกเกณฑ์ไม่ดีก็สามารถมี AUROC สูง แต่ความถูกต้องโดยรวมไม่ดี
การใช้งานจริง
ในทางปฏิบัติฉันชอบที่จะรวบรวมความแม่นยำโดยรวม AUROC และหากตัวจําแนกประเมินความน่าจะเป็นของการเป็นสมาชิกในชั้นเรียนข้อมูลข้ามเอนโทรปีหรือข้อมูลทำนายผล จากนั้นฉันก็มีการวัดที่วัดความสามารถในการดิบของมันเพื่อทำการจำแนกอย่างหนัก (สมมติว่าค่าการผิดประเภทการบวกและเชิงลบเท็จมีค่าเท่ากันและความถี่ของคลาสในกลุ่มตัวอย่างนั้นเหมือนกับการใช้ในการดำเนินงาน ตัวชี้วัดที่วัดความสามารถในการจัดอันดับรูปแบบและตัวชี้วัดที่วัดว่าการจัดอันดับถูกปรับเทียบเป็นความน่าจะเป็นได้ดีเพียงใด
สำหรับงานหลายอย่างค่าใช้จ่ายในการจำแนกประเภทการดำเนินงานไม่เป็นที่รู้จักหรือเปลี่ยนแปลงหรือความถี่ในการปฏิบัติงานแตกต่างจากในตัวอย่างการฝึกอบรมหรือเป็นตัวแปร ในกรณีดังกล่าวความแม่นยำโดยรวมมักไม่มีความหมายพอสมควรและ AUROC เป็นตัวบ่งชี้ประสิทธิภาพที่ดีกว่าและเราต้องการตัวแยกประเภทที่ให้ผลลัพธ์ที่มีความน่าจะเป็นที่สอบเทียบได้ดีเพื่อให้เราสามารถชดเชยปัญหาเหล่านี้ในการใช้งาน โดยพื้นฐานแล้วตัวชี้วัดตัวใดที่มีความสำคัญขึ้นอยู่กับปัญหาที่เราพยายามแก้ไข