ค่าเฉลี่ยความแม่นยำและการเรียกคืนเมื่อใช้การตรวจสอบความถูกต้องข้าม


11

ฉันทำการจำแนกประเภทโดยใช้ตัวแยกประเภทหลายตัวสำหรับข้อมูลที่มีป้ายกำกับ 2 ชั้นและฉันใช้การตรวจสอบความถูกต้องไขว้ 5 เท่า สำหรับแต่ละเท่าฉันคำนวณ tp, tn, fp และ fn จากนั้นฉันคำนวณความแม่นยำความแม่นยำการเรียกคืนและคะแนน F สำหรับการทดสอบแต่ละครั้ง คำถามของฉันคือเมื่อฉันต้องการผลลัพธ์โดยเฉลี่ยฉันใช้ค่าความถูกต้องโดยเฉลี่ย แต่ฉันสามารถหาค่าเฉลี่ยความแม่นยำการเรียกคืนและคะแนน F ได้หรือไม่ หรือนี่จะผิดทางคณิตศาสตร์หรือไม่? PS ชุดข้อมูลที่ใช้ในแต่ละครั้งนั้นมีความสมดุลในแง่ของจำนวนอินสแตนซ์ต่อคลาส

ขอบคุณ


3
ฉันพบปัญหาเดียวกันของคุณเกี่ยวกับการคำนวณค่า F (ค่าเฉลี่ยฮาร์มอนิกของความแม่นยำและการเรียกคืน) โดยใช้การตรวจสอบข้าม ในบทความนี้พวกเขาแสดงให้เห็นว่าจริง ๆ แล้วการคำนวณ F-measure ในชุดที่สมบูรณ์ไม่ใช่ค่าเฉลี่ยเป็นวิธีที่มีอคติน้อยกว่า ฉันหวังว่านี่จะช่วยได้
papafe

3
@markusian โปรดเพิ่มนี่เป็นคำตอบ! มันเป็นสิ่งที่สำคัญที่สุดในหน้านี้ !!
drevicko

คำตอบ:


2

คะแนนสมมติว่าคุณใช้คำจำกัดความปกติแล้วเป็นการผสมผสานระหว่างความแม่นยำและความจำ โดยเฉพาะมันเป็นค่าเฉลี่ยฮาร์โมนิกของพวกเขา กล่าวอีกนัยหนึ่งมันหมายถึงการจับ 'ประสิทธิผล' ของระบบที่ ผู้ใช้วางน้ำหนักที่เท่ากันกับความแม่นยำและการเรียกคืน มีส่วนขยายที่เรียกว่าคะแนนซึ่งให้น้ำหนักมากขึ้นในการเรียกคืนกว่าความแม่นยำ ใน ถ้าคุณถามว่าคุณสามารถเฉลี่ย 5F

F1=2precisionrecallprecision+recall
Fββ
Fβ=(1+β2)precisionrecall(β2precision)+recall
Fคะแนน (หนึ่งจากแต่ละเท่า) จากนั้นคำตอบคือใช่ ในความเป็นจริงนั้นเป็นวิธีทั่วไปในการรายงานประสิทธิภาพของระบบ!

เพิ่งทราบว่ามีปัญหาบางอย่างเกี่ยวกับการใช้ค่าเหล่านี้เพื่อทำการอนุมานเกี่ยวกับข้อผิดพลาดทั่วไปของตัวแยกประเภท ตัวอย่างเช่น -test ระหว่างคะแนนสำหรับตัวแยกประเภทหนึ่งและคะแนนสำหรับตัวแยกประเภทอื่นจะมองในแง่ดีเกินไปtFF


ใช่ฉันใช้สูตรแรก ซึ่งหมายความว่าการหาค่าเฉลี่ยของคะแนน F จากการทดสอบที่ต่างกันให้ผลลัพธ์ที่คล้ายกันกับค่าเฉลี่ยความแม่นยำและการเรียกคืนจากนั้นทำการคำนวณคะแนน F จากพวกเขา ฉันลองสิ่งนี้กับผลลัพธ์ที่ฉันมีและมันก็เกือบจะเหมือนกัน ขอบคุณ
Kalaji
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.