ความหมายที่เข้าใจง่ายที่สุดของคะแนน f1 นั้นถูกมองว่าเป็นค่าเฉลี่ยของการระลึกถึงและความแม่นยำ ขอให้ชัดเจนสำหรับคุณ:
ในงานการจัดหมวดหมู่คุณอาจวางแผนที่จะสร้างตัวจําแนกด้วยความแม่นยำสูงและเรียกคืน ตัวอย่างเช่นตัวจําแนกที่บอกว่าคนซื่อสัตย์หรือไม่
เพื่อความแม่นยำคุณมักจะสามารถบอกได้อย่างถูกต้องว่ามีคนซื่อสัตย์อยู่ในกลุ่มใด ในกรณีนี้เมื่อดูแลเกี่ยวกับความแม่นยำสูงคุณคิดว่าคุณสามารถจัดประเภทคนโกหกให้สัตย์ซื่อได้ แต่ไม่บ่อยนัก กล่าวอีกนัยหนึ่งที่นี่คุณพยายามระบุคนโกหกจากความซื่อสัตย์โดยรวมเป็นกลุ่ม
อย่างไรก็ตามสำหรับการเรียกคืนคุณจะต้องกังวลมากถ้าคุณคิดว่าคนโกหกเป็นคนซื่อสัตย์ สำหรับคุณนี่จะเป็นการสูญเสียครั้งใหญ่และเป็นความผิดพลาดครั้งใหญ่และคุณไม่ต้องการทำมันอีก นอกจากนี้มันก็โอเคถ้าคุณจำแนกคนที่ซื่อสัตย์ว่าเป็นคนโกหก แต่โมเดลของคุณไม่ควร (หรือส่วนใหญ่ไม่ให้) อ้างว่าคนที่โกหกนั้นเป็นคนซื่อสัตย์ กล่าวอีกนัยหนึ่งที่นี่คุณกำลังมุ่งเน้นไปที่ชั้นเรียนที่เฉพาะเจาะจงและคุณกำลังพยายามที่จะไม่ทำผิดเกี่ยวกับมัน
ตอนนี้ให้นำกรณีที่คุณต้องการให้แบบจำลองของคุณเป็น (1) ระบุความซื่อสัตย์จากคนโกหก (แม่นยำ) (2) ระบุแต่ละคนจากทั้งสองคลาส (จำได้) อย่างแม่นยำ ซึ่งหมายความว่าคุณจะเลือกรูปแบบที่จะทำงานได้ดีทั้งบนเมตริก
การตัดสินใจเลือกรูปแบบของคุณนั้นจะพยายามประเมินแต่ละโมเดลตามค่าเฉลี่ยของสองเมตริก F-Score ดีที่สุดที่สามารถอธิบายสิ่งนี้ได้ ลองมาดูสูตร:
เรียกคืน: p = tp / (tp + fp)
เรียกคืน: r = tp / (tp + fn)
คะแนน F: fscore = 2 / (1 / r + 1 / p)
ตามที่คุณเห็นการเรียกคืนและความแม่นยำสูงกว่าคะแนน F สูงขึ้น