เหตุผลในการใช้ AUC?


10

โดยเฉพาะอย่างยิ่งในด้านวิทยาศาสตร์คอมพิวเตอร์ของวรรณกรรมการเรียนรู้ของเครื่อง AUC (พื้นที่ภายใต้เส้นโค้งลักษณะตัวดำเนินการรับ) เป็นเกณฑ์ยอดนิยมสำหรับการประเมินตัวแยกประเภท การใช้ AUC มีเหตุผลอะไรบ้าง เช่นมีฟังก์ชั่นการสูญเสียพิเศษซึ่งการตัดสินใจที่เหมาะสมที่สุดคือตัวจําแนกด้วย AUC ที่ดีที่สุดหรือไม่


1
AUC เป็นฟังก์ชันการสูญเสียเป็นที่ชัดเจนว่าสำหรับฟังก์ชันการสูญเสียนี้การตัดสินใจที่เหมาะสมที่สุดคือตัวจําแนกด้วย AUC ที่ดีที่สุด
robin girard

1
@robingirard ไม่มันไม่ใช่เพราะมันไม่แตกต่างกันนั่นคือคุณไม่สามารถปรับให้เหมาะสมได้โดยตรง
cpury

คำตอบ:



0

ลองมาตัวอย่างง่ายๆในการระบุมะเขือเทศที่ดีจากสระว่ายน้ำของมะเขือเทศที่ดีและไม่ดี สมมติว่าจำนวนมะเขือเทศที่ดีคือ 100 และมะเขือเทศที่ไม่ดีคือ 1,000 ดังนั้นทั้งหมด 1100 ตอนนี้งานของคุณคือการระบุมะเขือเทศที่ดีที่สุดเท่าที่จะทำได้ วิธีหนึ่งในการรับมะเขือเทศที่ดีทั้งหมดกำลังนำมะเขือเทศทั้งหมด 1100 ใบไปด้วย แต่มันชัดเจนว่าคุณจะไม่สามารถแยกความแตกต่าง b / n ดี VS ไม่ดี

ดังนั้นอะไรคือวิธีที่เหมาะสมในการแยกแยะความแตกต่าง - ต้องได้คนดีจำนวนมากในขณะที่เก็บคนเลวน้อยมากดังนั้นเราต้องมีสิ่งที่วัดได้ซึ่งสามารถพูดได้ว่าคนดีจำนวนมากที่เราหยิบขึ้นมาและพูดว่า มัน. การวัด AUC ให้น้ำหนักมากขึ้นหากสามารถเลือกสิ่งที่ดีกว่าด้วยตัววัดที่ไม่ดีตามที่อธิบายไว้ด้านล่าง ซึ่งบอกว่าคุณสามารถแยกแยะ b / n ดีและไม่ดีอย่างไร

ในตัวอย่างคุณสามารถสังเกตได้ว่าในขณะที่หยิบมะเขือเทศที่ดีขึ้น 70% เส้นโค้งสีดำหยิบขึ้นมาประมาณ 48% ของคนที่ไม่ดี (ไม่บริสุทธิ์) แต่คนที่สีน้ำเงินนั้นมีคนที่ไม่ดี 83% (ที่ไม่บริสุทธิ์) ดังนั้นเส้นโค้งสีดำจึงมีคะแนน AUC ที่ดีกว่าเมื่อเทียบกับสีน้ำเงิน ป้อนคำอธิบายรูปภาพที่นี่


คำถามนี้จะตอบคำถามได้อย่างไร
Vivek Subramanian

ฉันเขียนด้วยสัญชาตญาณของ AUC ว่าจะช่วยให้คะแนนเดียวในการระบุสิ่งที่ดี (1 ในการจำแนกไบนารี) ในประชากรทั้งหมดในขณะที่ลดจำนวนของผลบวกที่ผิดพลาด ช่วยฉันด้วยวิธีนี้ฉันทำได้ดีกว่านี้
yugandhar
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.