เพื่อที่จะทราบว่ามีข้อมูลมากขึ้นหรือไม่จะเป็นประโยชน์หรือไม่คุณควรเปรียบเทียบประสิทธิภาพของอัลกอริทึมของคุณกับข้อมูลการฝึกอบรม (เช่นข้อมูลที่ใช้ในการฝึกอบรมโครงข่ายประสาทเทียม) กับประสิทธิภาพในการทดสอบข้อมูล (เช่นข้อมูลที่ ไม่ "เห็น" ในการฝึกอบรม)
สิ่งที่ดีในการตรวจสอบคือข้อผิดพลาด (หรือความถูกต้อง) ในแต่ละชุดเป็นฟังก์ชันของหมายเลขการวนซ้ำ มีความเป็นไปได้สองอย่างสำหรับผลลัพธ์ของสิ่งนี้:
1) ข้อผิดพลาดการฝึกอบรมมาบรรจบกับค่าต่ำกว่าข้อผิดพลาดการทดสอบอย่างมีนัยสำคัญ หากเป็นกรณีนี้ประสิทธิภาพของอัลกอริทึมของคุณจะเพิ่มขึ้นอย่างแน่นอนด้วยข้อมูลที่มากขึ้น
2) ข้อผิดพลาดการฝึกอบรมและข้อผิดพลาดการทดสอบมาบรรจบกันเกี่ยวกับค่าเดียวกัน (กับข้อผิดพลาดการฝึกอบรมอาจยังคงต่ำกว่าข้อผิดพลาดการทดสอบเล็กน้อย) ในกรณีนี้ข้อมูลเพิ่มเติมด้วยตัวเองจะไม่ช่วยอัลกอริทึมของคุณ หากคุณต้องการประสิทธิภาพที่ดีกว่าที่คุณได้รับ ณ จุดนี้คุณควรลองเพิ่มเซลล์ประสาทเข้าไปในเลเยอร์ที่ซ่อนอยู่ของคุณหรือเพิ่มเลเยอร์ที่ซ่อนอยู่เพิ่มเติม หากมีการเพิ่มหน่วยที่ซ่อนไว้เพียงพอคุณจะพบข้อผิดพลาดในการทดสอบของคุณจะสูงกว่าข้อผิดพลาดในการฝึกอบรมอย่างเห็นได้ชัดและข้อมูลเพิ่มเติมจะช่วยได้ ณ จุดนั้น
สำหรับการแนะนำอย่างละเอียดและเป็นประโยชน์มากขึ้นเกี่ยวกับวิธีการตัดสินใจเหล่านี้ฉันขอแนะนำหลักสูตร Courseraของ Andrew Ng โดยเฉพาะอย่างยิ่ง "การประเมินขั้นตอนวิธีการเรียนรู้" และ "Bias vs. Variance"