ฉันหวังว่าข้อความที่ตัดตอนมาต่อไปนี้จะให้ข้อมูลเชิงลึกเกี่ยวกับสิ่งที่คำถามของฉันจะเป็น เหล่านี้มาจากhttp://neuralnetworksanddeeplearning.com/chap3.html
การเรียนรู้จะค่อยๆช้าลง ในที่สุดเมื่อประมาณ 280 ยุคความแม่นยำในการจัดหมวดหมู่ก็ค่อนข้างดีขึ้น หลังจากนั้นก็เห็นความผันผวนเล็ก ๆ ใกล้เคียงกับค่าความถูกต้องที่ยุค 280 ตัดกันสิ่งนี้กับกราฟก่อนหน้าซึ่งค่าใช้จ่ายที่เกี่ยวข้องกับข้อมูลการฝึกอบรมยังคงลดลงอย่างราบรื่น หากเราเพียงแค่ดูค่าใช้จ่ายนั้นปรากฏว่าโมเดลของเรายังคง "ดีขึ้น" แต่ผลการทดสอบความแม่นยำแสดงว่าการปรับปรุงเป็นภาพลวงตา เช่นเดียวกับรุ่นที่ Fermi ไม่ชอบสิ่งที่เครือข่ายของเราเรียนรู้หลังจากยุค 280 ไม่ได้สรุปข้อมูลการทดสอบอีกต่อไป ดังนั้นการเรียนรู้จึงไม่มีประโยชน์ เราบอกว่าเครือข่ายกำลัง overfitting หรือ overtraining เกินยุค 280
เรากำลังฝึกอบรมเครือข่ายประสาทและค่าใช้จ่าย (จากข้อมูลการฝึกอบรม) ลดลงจนถึงยุค 400 แต่ความถูกต้องของการจัดหมวดหมู่กลายเป็นแบบคงที่ (ยกเว้นความผันผวนสุ่มเล็กน้อย) หลังจากยุค 280 ดังนั้นเราจึงสรุปได้ว่า
เราสามารถเห็นได้ว่าค่าใช้จ่ายในข้อมูลการทดสอบเพิ่มขึ้นจนถึงราว ๆ ยุค 15 แต่หลังจากนั้นมันก็เริ่มแย่ลงถึงแม้ว่าค่าใช้จ่ายในข้อมูลการฝึกอบรมจะดีขึ้นเรื่อย ๆ นี่เป็นอีกสัญญาณว่าโมเดลของเรากำลัง overfitting มันเป็นปริศนาที่ว่าเราควรพิจารณายุค 15 หรือยุค 280 ว่าเป็นจุดที่ overfitting กำลังเข้าครอบงำการเรียนรู้หรือไม่ จากมุมมองของภาคปฏิบัติสิ่งที่เราใส่ใจคือการปรับปรุงความถูกต้องในการจัดหมวดหมู่ของข้อมูลการทดสอบในขณะที่ค่าใช้จ่ายในข้อมูลการทดสอบไม่เกินพร็อกซีสำหรับความแม่นยำในการจำแนกประเภท ดังนั้นจึงเป็นเรื่องที่สมเหตุสมผลที่จะคำนึงถึงยุค 280 ว่าเป็นเรื่องที่เกินความจริงที่ครอบงำการเรียนรู้ในเครือข่ายประสาทของเรา
ตรงข้ามกับความถูกต้องของการจัดหมวดหมู่ของข้อมูลการทดสอบเทียบกับค่าฝึกอบรมก่อนหน้านี้ตอนนี้เรากำลังวางข้อมูลการทดสอบเทียบกับค่าฝึกอบรม
จากนั้นหนังสือจะอธิบายต่อไปว่าทำไม 280 จึงเป็นยุคที่ถูกต้องที่เริ่มมีการบรรจุมากเกินไป นั่นคือสิ่งที่ฉันมีปัญหากับ ฉันห่อหัวของฉันไม่ได้
เรากำลังขอให้แบบจำลองเพื่อลดต้นทุนและค่าใช้จ่ายจึงเป็นตัวชี้วัดที่ใช้เป็นตัวชี้วัดความแข็งแกร่งของตัวเองเพื่อจัดประเภทอย่างถูกต้อง หากเราถือว่า 280 เป็นจุดเริ่มต้นที่เหมาะสมของการเริ่มต้น overfitting เราไม่ได้สร้างแบบจำลองแบบเอนเอียงซึ่งแม้ว่าจะเป็นตัวจําแนกที่ดีขึ้นในข้อมูลการทดสอบโดยเฉพาะ แต่อย่างไรก็ตามการตัดสินใจด้วยความมั่นใจต่ำและมีแนวโน้มที่จะเบี่ยงเบน จากผลลัพธ์ที่แสดงในข้อมูลการทดสอบ?