ในทฤษฎีการเรียนรู้ทางสถิติไม่มีปัญหาเรื่องการกำหนดค่าส่วนเกินในชุดทดสอบหรือไม่?


16

ลองพิจารณาปัญหาเกี่ยวกับการจำแนกชุดข้อมูล MNIST

ตามหน้าเว็บ MNIST ของ Yann LeCun , 'Ciresan et al.' ได้รับอัตราความผิดพลาด 0.23% สำหรับชุดทดสอบ MNIST โดยใช้ Convolutional Neural Network

การฝึกอบรมชุดแสดงว่า MNIST Let 's เป็น , MNIST ชุดทดสอบเป็นD ทีอีs Tสมมติฐานสุดท้ายที่พวกเขาได้ใช้D T r ฉันnเป็นเอช1และอัตราความผิดพลาดของพวกเขาใน MNIST ทดสอบตั้งค่าการใช้เอช1เป็นอีทีอีs T ( เอช1 ) = 0.0023DtrainDtestDtrainh1h1Etest(h1)=0.0023

ในมุมมองของพวกเขาเนื่องจากถูกสุ่มตัวอย่างชุดทดสอบจากพื้นที่อินพุตโดยไม่คำนึงถึงh 1พวกเขาสามารถยืนยันได้ว่าประสิทธิภาพข้อผิดพลาดนอกตัวอย่างของสมมติฐานสุดท้ายของพวกเขาE o u t ( h 1 )มีขอบเขตดังนี้ จากความไม่เท่าเทียมของ Hoeffding P [ | E o ยูที ( เอช1 ) - อีทีอีs T ( เอช1 ) | < ϵ | ]Dtesth1Eout(h1) ที่ไม่มีข้อความทีอีs T = | D t e s t | .

P[|Eout(h1)Etest(h1)|<ϵ|]12e2ϵ2Ntest

Ntest=|Dtest|

อีกนัยหนึ่งความน่าจะเป็นอย่างน้อย , E o u t ( h 1 ) E t e s t ( h 1 ) + 1δ

Eout(h1)Etest(h1)+12Ntestln2δ

ลองพิจารณามุมมองอื่น สมมติว่าบางคนต้องการจัดประเภทการทดสอบ MNIST เป็นอย่างดี ดังนั้นเขาจึงดูที่หน้าเว็บ MNIST ของ Yann LeCun เป็นครั้งแรกและพบว่าคนอื่น ๆ ได้ผลลัพธ์ตามที่ได้รับจากโมเดลที่แตกต่างกัน 8 แบบ

ผลการจำแนกประเภท MNIST

g

gDtestHtrained={h1,h2,..,h8}

Etest(g)

P[|Eout(g)Ein(g)|<ϵ]12|Htrained|e2ϵ2Ntest

1δ

Eout(g)Etest(g)+12Ntestln2|Htrained|δ

ผลลัพธ์นี้แสดงให้เห็นว่าอาจมีการ overfitting ในชุดทดสอบหากเราเลือกแบบจำลองมีประสิทธิภาพดีที่สุดในหลายรุ่น

h1Etest(h1)=0.0023h1Dtesth1

Eout(h1)Etest(h1)+12Ntestln2|Htrained|δ

P[Eout(h1)Etest(h1)+12Ntestln2δ]1δ
P[Eout(h1)Etest(h1)+12Ntestln2|Htrained|δ]1δ

Howerver เป็นที่ชัดเจนว่าความไม่เท่าเทียมกันทั้งสองนี้เข้ากันไม่ได้

ฉันทำผิดตรงไหน อันไหนถูกและอันไหนผิด?

หากหลังผิดวิธีที่ถูกต้องในการนำ VC มาใช้กับข้อ จำกัด แน่นอนในกรณีนี้คืออะไร?

คำตอบ:


1

g=h1gh1

gHtrained={h1,h2,...,h8}Dtest

gDtestDtestg(Dtest)=h1g(Dtest)Htrainedh1Htrained

สำหรับคำถามอื่น ๆ :

หากหลังผิดวิธีที่ถูกต้องในการนำ VC มาใช้กับข้อ จำกัด แน่นอนในกรณีนี้คืออะไร?

อย่าเพิ่งเปลี่ยน gh1gh1

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.