ในหลายกรณีที่คุณใช้อัลกอริทึมการจัดอันดับ (เช่นการค้นหาโดย Google คำแนะนำผลิตภัณฑ์ของ Amazon) คุณมีผลลัพธ์นับแสนรายการ ผู้ใช้ต้องการดูที่ด้านบน ~ 20 หรือมากกว่านั้น ดังนั้นส่วนที่เหลือไม่เกี่ยวข้องอย่างสมบูรณ์
k
หากสิ่งนี้เป็นจริงสำหรับแอปพลิเคชันของคุณนี่จะมีผลกระทบโดยตรงต่อการวัด:
- kk
- 2k
kk
ความแม่นยำในการจำแนกระดับ k สำหรับการจัดอันดับ
สำหรับความจริงพื้นฐานอาจเป็นเรื่องยากที่จะกำหนดคำสั่ง และถ้าคุณแยกแยะที่เกี่ยวข้อง / ไม่เกี่ยวข้องก็เท่ากับว่าคุณอยู่ในการจำแนกประเภท!
ความแม่นยำสูงสุดคือตัวชี้วัดสำหรับการจำแนกประเภท ดูคำจำกัดความของความแม่นยำสูงสุดคืออะไร .
top-k accuracy=how often was at least one relevant element within the top-k of a ranking query?ranking queries
k
kk∈[5,20]
k
แม่นยำ @ k
Precision@k=number of relevant items within the top-kk∈[0,1], higher is better
มันบอกอะไรคุณ:
- ถ้าสูง -> สิ่งที่คุณแสดงต่อผู้ใช้นั้นเกี่ยวข้องกับพวกเขามาก
- ถ้าต่ำ -> คุณเสียเวลาผู้ใช้ สิ่งที่คุณแสดงให้เห็นส่วนใหญ่ไม่เกี่ยวข้องกับพวกเขา
จำ @ k
Recall@k=number of relevant items within the top-ktotal number of relevant items∈[0,1], higher is better
มันหมายถึงอะไร:
- ถ้าสูง: คุณแสดงสิ่งที่คุณมี! คุณให้รายการที่เกี่ยวข้องทั้งหมดกับพวกเขา
- หากต่ำ: เปรียบเทียบกับจำนวนทั้งหมดของรายการที่เกี่ยวข้อง k มีขนาดเล็ก / รายการที่เกี่ยวข้องภายใน k มีขนาดเล็ก ด้วยเหตุนี้การเรียกคืน @ k อย่างเดียวอาจไม่มีความหมายมากนัก หากรวมกับความแม่นยำสูง @ k ดังนั้นการเพิ่ม k อาจสมเหตุสมผล