ฉันใช้การตรวจสอบความถูกต้องไขว้แบบ 10 เท่าสำหรับอัลกอริธึมการจำแนกประเภทไบนารีที่แตกต่างกันโดยมีชุดข้อมูลเดียวกันและได้รับผลลัพธ์เฉลี่ยทั้งไมโครและมาโคร ควรกล่าวถึงว่านี่เป็นปัญหาการจำแนกประเภทฉลากหลายป้าย
ในกรณีของฉันเชิงลบที่แท้จริงและผลบวกที่แท้จริงนั้นมีน้ำหนักเท่ากัน นั่นหมายความว่าการทำนายเชิงลบที่ถูกต้องนั้นมีความสำคัญไม่แพ้กันกับการทำนายผลบวกที่แท้จริง
การวัดแบบไมโครเฉลี่ยต่ำกว่าค่าเฉลี่ยของมาโคร นี่คือผลลัพธ์ของ Neural Network และ Support Vector Machine:
ฉันยังใช้การทดสอบแบ่งเปอร์เซ็นต์บนชุดข้อมูลเดียวกันด้วยอัลกอริทึมอื่น ผลการวิจัยพบว่า:
ฉันอยากจะเปรียบเทียบการทดสอบแบ่งเปอร์เซ็นต์กับผลลัพธ์ที่ได้มาโครเฉลี่ย แต่สิ่งนั้นยุติธรรมหรือไม่ ฉันไม่เชื่อว่าผลลัพธ์เฉลี่ยแบบมาโครนั้นมีความลำเอียงเพราะผลบวกจริงและเชิงลบที่แท้จริงนั้นมีน้ำหนักเท่ากัน แต่จากนั้นอีกครั้งฉันสงสัยว่านี่จะเหมือนกับการเปรียบเทียบแอปเปิ้ลกับส้มหรือไม่?
UPDATE
จากความคิดเห็นฉันจะแสดงให้เห็นว่าการคำนวณไมโครและมาโครเฉลี่ยคำนวณอย่างไร
ฉันมี 144 ป้ายกำกับ (เช่นเดียวกับคุณสมบัติหรือคุณลักษณะ) ที่ฉันต้องการทำนาย ความแม่นยำการเรียกคืนและการวัดค่า F ถูกคำนวณสำหรับแต่ละฉลาก
---------------------------------------------------
LABEL1 | LABEL2 | LABEL3 | LABEL4 | .. | LABEL144
---------------------------------------------------
? | ? | ? | ? | .. | ?
---------------------------------------------------
พิจารณาการวัดผลการประเมินเลขฐานสอง B (tp, tn, fp, fn) ที่คำนวณจากผลบวกจริง (tp), ลบจริง (tn), ลบบวก (fp) และลบเชิงลบ (fn) ค่าเฉลี่ยของมาโครและไมโครของการวัดที่เฉพาะเจาะจงสามารถคำนวณได้ดังนี้:
การใช้สูตรเหล่านี้เราสามารถคำนวณค่าเฉลี่ยไมโครและมาโครดังนี้:
ดังนั้นการวัดแบบไมโครเฉลี่ยจึงเพิ่ม tp, fp และ fn ทั้งหมด (สำหรับแต่ละ label) หลังจากนั้นจะทำการประเมินไบนารีใหม่ การวัดค่าเฉลี่ยแบบมาโครจะเพิ่มการวัดทั้งหมด (ความแม่นยำการเรียกคืนหรือการวัดค่า F) แล้วหารด้วยจำนวนป้ายกำกับซึ่งมีลักษณะเหมือนค่าเฉลี่ยมากขึ้น
ตอนนี้คำถามที่เป็นที่หนึ่งที่จะใช้?