มีวิธีมาตรฐานใด ๆ ในการพิจารณาจุดการทำงาน "ที่เหมาะสมที่สุด" บนกราฟการเรียกคืนที่แม่นยำหรือไม่? (เช่นการกำหนดจุดบนเส้นโค้งที่ให้การแลกเปลี่ยนที่ดีระหว่างความแม่นยำและการเรียกคืน)
ขอบคุณ
มีวิธีมาตรฐานใด ๆ ในการพิจารณาจุดการทำงาน "ที่เหมาะสมที่สุด" บนกราฟการเรียกคืนที่แม่นยำหรือไม่? (เช่นการกำหนดจุดบนเส้นโค้งที่ให้การแลกเปลี่ยนที่ดีระหว่างความแม่นยำและการเรียกคืน)
ขอบคุณ
คำตอบ:
แน่นอนว่าคำจำกัดความของ "ดีที่สุด" จะขึ้นอยู่กับเป้าหมายเฉพาะของคุณ แต่นี่เป็นวิธีการ "มาตรฐาน" ที่ค่อนข้างน้อย:
จุดอัตราความผิดพลาดที่เท่าเทียมกัน (EER): จุดที่ความแม่นยำเท่ากับการเรียกคืน บางคนรู้สึกเหมือนเป็นจุดปฏิบัติการที่ "เป็นธรรมชาติ"
เวอร์ชันด้านบนและที่ละเอียดกว่านั้นคือการระบุค่าใช้จ่ายของข้อผิดพลาดประเภทต่างๆและปรับค่าใช้จ่ายให้เหมาะสม สมมติว่าการจัดประเภทรายการ (ข้อผิดพลาดอย่างแม่นยำ) มีราคาแพงกว่าสินค้าที่หายไปสองเท่า (เกิดข้อผิดพลาดในการเรียกคืน) จุดปฏิบัติการที่ดีที่สุดคือที่ (1 - เรียกคืน) = 2 * (1 - ความแม่นยำ)
ในบางปัญหาผู้คนมีอัตราความแม่นยำหรือการเรียกคืนที่น้อยที่สุดตามธรรมชาติ สมมติว่าคุณรู้ว่าหากข้อมูลที่ดึงมามากกว่า 20% ไม่ถูกต้องผู้ใช้จะหยุดใช้แอปพลิเคชันของคุณ จากนั้นเป็นธรรมชาติที่จะตั้งค่าความแม่นยำเป็น 80% (หรือต่ำกว่านั้นเล็กน้อย) และยอมรับการเรียกคืนใด ๆ ก็ตามที่คุณมี ณ จุดนั้น
การติดตามสัญลักษณ์แสดงหัวข้อย่อยที่สองและสามของ SheldonCooper: ตัวเลือกในอุดมคติคือการให้คนอื่นทำการเลือกไม่ว่าจะเป็นในรูปแบบของเกณฑ์ (จุด 3) หรือผลประโยชน์ด้านต้นทุน (จุด 2) และอาจจะเป็นวิธีที่ดีที่สุดเพื่อให้พวกเขาเลือกเป็นของที่มีเส้นโค้ง ROC
ฉันไม่แน่ใจว่านี่คือ "มาตรฐาน" แต่วิธีหนึ่งคือการเลือกจุดที่ใกล้เคียงที่สุด (1, 1) - เช่นการเรียกคืน 100% และความแม่นยำ 100% นั่นจะเป็นความสมดุลที่เหมาะสมที่สุดระหว่างสองมาตรการ สิ่งนี้ถือว่าคุณไม่เห็นคุณค่าของความแม่นยำในการเรียกคืนหรือในทางกลับกัน