ลองพิจารณาปัญหาเกี่ยวกับการจำแนกชุดข้อมูล MNIST
ตามหน้าเว็บ MNIST ของ Yann LeCun , 'Ciresan et al.' ได้รับอัตราความผิดพลาด 0.23% สำหรับชุดทดสอบ MNIST โดยใช้ Convolutional Neural Network
การฝึกอบรมชุดแสดงว่า MNIST Let 's เป็น , MNIST ชุดทดสอบเป็นD ทีอีs Tสมมติฐานสุดท้ายที่พวกเขาได้ใช้D T r ฉันnเป็นเอช1และอัตราความผิดพลาดของพวกเขาใน MNIST ทดสอบตั้งค่าการใช้เอช1เป็นอีทีอีs T ( เอช1 ) = 0.0023
ในมุมมองของพวกเขาเนื่องจากถูกสุ่มตัวอย่างชุดทดสอบจากพื้นที่อินพุตโดยไม่คำนึงถึงh 1พวกเขาสามารถยืนยันได้ว่าประสิทธิภาพข้อผิดพลาดนอกตัวอย่างของสมมติฐานสุดท้ายของพวกเขาE o u t ( h 1 )มีขอบเขตดังนี้ จากความไม่เท่าเทียมของ Hoeffding P [ | E o ยูที ( เอช1 ) - อีทีอีs T ( เอช1 ) | < ϵ | ] ที่ไม่มีข้อความทีอีs T = | D t e s t | .
อีกนัยหนึ่งความน่าจะเป็นอย่างน้อย , E o u t ( h 1 ) ≤ E t e s t ( h 1 ) + √
ลองพิจารณามุมมองอื่น สมมติว่าบางคนต้องการจัดประเภทการทดสอบ MNIST เป็นอย่างดี ดังนั้นเขาจึงดูที่หน้าเว็บ MNIST ของ Yann LeCun เป็นครั้งแรกและพบว่าคนอื่น ๆ ได้ผลลัพธ์ตามที่ได้รับจากโมเดลที่แตกต่างกัน 8 แบบ
ผลลัพธ์นี้แสดงให้เห็นว่าอาจมีการ overfitting ในชุดทดสอบหากเราเลือกแบบจำลองมีประสิทธิภาพดีที่สุดในหลายรุ่น
Howerver เป็นที่ชัดเจนว่าความไม่เท่าเทียมกันทั้งสองนี้เข้ากันไม่ได้
ฉันทำผิดตรงไหน อันไหนถูกและอันไหนผิด?
หากหลังผิดวิธีที่ถูกต้องในการนำ VC มาใช้กับข้อ จำกัด แน่นอนในกรณีนี้คืออะไร?