TLDR:
ชุดข้อมูลของฉันมีขนาดค่อนข้างเล็ก (120) ตัวอย่าง ในขณะที่ทำการตรวจสอบข้าม 10 เท่าฉันควร:
รวบรวมผลลัพธ์จากการทดสอบแต่ละครั้งแล้วเรียงต่อกันเป็นเวกเตอร์แล้วคำนวณข้อผิดพลาดของการทำนายแบบเต็ม (ตัวอย่าง 120 ตัวอย่าง) หรือไม่
หรือฉันควรแทนคำนวณข้อผิดพลาดในผลที่ฉันได้รับในแต่ละพับ (12 ตัวอย่างต่อเท่า) แล้วได้รับการประมาณการข้อผิดพลาดของฉันสุดท้ายเป็นค่าเฉลี่ยของ 10 ประมาณการผิดพลาดเท่า?
มีเอกสารทางวิทยาศาสตร์ใดบ้างที่โต้แย้งความแตกต่างระหว่างเทคนิคเหล่านี้
พื้นหลัง: ความสัมพันธ์ที่อาจเกิดขึ้นกับคะแนนแมโคร / Micro ในการจำแนกประเภทหลายฉลาก:
ฉันคิดว่าคำถามนี้อาจเกี่ยวข้องกับความแตกต่างระหว่างค่าเฉลี่ยไมโครและมาโครที่มักใช้ในงานการจำแนกประเภทหลายฉลาก (เช่นพูด 5 ป้ายกำกับ)
ในการตั้งค่าแบบหลายฉลากจะคำนวณคะแนนเฉลี่ยขนาดเล็กโดยการทำตารางสรุปรวมของค่าบวกจริงเท็จบวกลบจริงและลบเท็จสำหรับการพยากรณ์ลักษณนามทั้งหมด 5 ตัวใน 120 ตัวอย่าง ตารางฉุกเฉินนี้จะใช้ในการคำนวณความแม่นยำระดับไมโครการเรียกคืนแบบไมโครและการวัดไมโคร f ดังนั้นเมื่อเรามี 120 ตัวอย่างและตัวแยกประเภทห้าตัวการวัดขนาดเล็กจะคำนวณจากการคาดการณ์ 600 ครั้ง (120 ตัวอย่าง * 5 ป้าย)
เมื่อใช้ตัวแปรมาโครหนึ่งจะคำนวณการวัด (ความแม่นยำการเรียกคืนและอื่น ๆ ) อย่างเป็นอิสระในแต่ละฉลากและสุดท้ายมาตรการเหล่านี้จะถูกเฉลี่ย
แนวคิดที่อยู่เบื้องหลังความแตกต่างระหว่างการประมาณแบบmicro vs Macroอาจขยายไปถึงสิ่งที่สามารถทำได้ในการตั้งค่า K-fold ในปัญหาการจำแนกประเภทไบนารี สำหรับ 10 เท่าเราสามารถเฉลี่ยมากกว่า 10 ค่า (การวัดมาโคร ) หรือทำการต่อ 10 การทดลองและคำนวณวัดขนาดเล็ก
พื้นหลัง - ตัวอย่างที่ขยาย:
ตัวอย่างต่อไปนี้แสดงคำถาม สมมติว่าเรามี 12 ตัวอย่างทดสอบและเรามี 10 เท่า:
- พับ 1 : TP = 4, FP = 0, TN = 8 Precision = 1.0
- พับ 2 : TP = 4, FP = 0, TN = 8 Precision = 1.0
- พับ 3 : TP = 4, FP = 0, TN = 8 Precision = 1.0
- พับ 4 : TP = 0, FP = 12, Precision = 0
- พับ 5 .. พับ 10 : ทั้งหมดมีTPเดียวกัน= 0, FP = 12 และแม่นยำ = 0
ที่ฉันใช้สัญกรณ์ต่อไปนี้:
TP = # ของ True Positives, FP = # False Positive, TN = # ของ True Negatives
ผลลัพธ์ที่ได้คือ:
- ความแม่นยำเฉลี่ยในช่วง 10 เท่า = 3/10 = 0.3
- ความแม่นยำในการต่อเชื่อมการคาดคะเน 10 เท่า = TP / TP + FP = 12/12 + 84 = 0.125
โปรดทราบว่าค่า 0.3 และ 0.125 นั้นแตกต่างกันมาก !