เป็นความจริงที่การ จำกัด การแพร่กระจายของการไล่ระดับสีเป็น 30 ขั้นตอนจะป้องกันไม่ให้เรียนรู้ทุกอย่างที่เป็นไปได้ในชุดข้อมูลของคุณ อย่างไรก็ตามมันขึ้นอยู่กับชุดข้อมูลของคุณว่าจะป้องกันไม่ให้เรียนรู้สิ่งสำคัญเกี่ยวกับคุณสมบัติในแบบจำลองของคุณ!
การ จำกัด การไล่ระดับสีในระหว่างการฝึกนั้นเป็นเหมือนการ จำกัด หน้าต่างซึ่งโมเดลของคุณสามารถรวมคุณสมบัติการป้อนข้อมูลและสถานะที่ซ่อนไว้ด้วยความมั่นใจสูง เนื่องจากในเวลาทดสอบคุณใช้แบบจำลองของคุณกับลำดับอินพุตทั้งหมดจึงยังสามารถรวมข้อมูลเกี่ยวกับคุณลักษณะอินพุตทั้งหมดเข้าสู่สถานะที่ซ่อนอยู่ได้ มันอาจจะไม่ทราบว่าวิธีการรักษาข้อมูลที่จนกว่ามันจะทำให้การคาดการณ์ครั้งสุดท้ายสำหรับประโยค แต่อาจจะมีบาง (เป็นที่ยอมรับปรับตัวลดลง) การเชื่อมต่อว่ามันจะยังคงสามารถที่จะทำให้
คิดก่อนเกี่ยวกับตัวอย่างที่วางแผนไว้ สมมติว่าเครือข่ายของคุณคือการสร้าง 1 หากมี 1 ที่ใดก็ได้ในการป้อนข้อมูลของตนและ 0 เป็นอย่างอื่น สมมติว่าคุณฝึกอบรมเครือข่ายตามลำดับความยาว 20 และ จำกัด จากนั้นไล่ระดับเป็น 10 ขั้น หากชุดข้อมูลการฝึกอบรมไม่เคยมี 1 ใน 10 ขั้นตอนสุดท้ายของอินพุตจากนั้นเครือข่ายจะมีปัญหากับอินพุตทดสอบของการกำหนดค่าใด ๆ อย่างไรก็ตามหากชุดการฝึกอบรมมีตัวอย่างเช่น [1 0 0 ... 0 0 0] และอื่น ๆ เช่น [0 0 0 ... 1 0 0] จากนั้นเครือข่ายจะสามารถรับ "สถานะของ 1 "คุณสมบัติใดก็ได้ในอินพุตของมัน
กลับไปวิเคราะห์ความเชื่อมั่นแล้ว สมมติว่าในระหว่างการฝึกแบบจำลองของคุณจะพบประโยคลบที่ยาวเช่น "ฉันเกลียดสิ่งนี้เพราะ ... รอบ ๆ " โดยพูด 50 คำในจุดไข่ปลา ด้วยการ จำกัด การแพร่กระจายของการไล่ระดับสีให้เหลือ 30 ขั้นตอนโมเดลจะไม่เชื่อมต่อ "ฉันเกลียดสิ่งนี้เพราะ" กับฉลากผลลัพธ์ดังนั้นมันจะไม่รับ "I", "เกลียด" หรือ "สิ่งนี้" จากการฝึกอบรมนี้ ตัวอย่าง. แต่จะรับกับคำที่อยู่ภายใน 30 ขั้นตอนจากจุดสิ้นสุดของประโยค หากชุดการฝึกอบรมของคุณมีตัวอย่างอื่น ๆ ที่มีคำเดียวกันเหล่านั้นอาจเป็นไปได้พร้อมกับ "ความเกลียดชัง" ก็มีโอกาสที่จะได้รับการเชื่อมโยงระหว่าง "ความเกลียดชัง" และฉลากความรู้สึกเชิงลบ นอกจากนี้หากคุณมีตัวอย่างการฝึกอบรมที่สั้นลงให้พูดว่า "เราเกลียดสิ่งนี้เพราะมันแย่มาก!" โมเดลของคุณจะสามารถเชื่อมต่อฟีเจอร์ "เกลียดชัง" และ "นี่" กับป้ายกำกับเป้าหมายได้ หากคุณมีตัวอย่างการฝึกอบรมเหล่านี้เพียงพอโมเดลควรจะเรียนรู้การเชื่อมต่อได้อย่างมีประสิทธิภาพ
ในเวลาทดสอบสมมติว่าคุณนำเสนอโมเดลด้วยประโยคยาว ๆ อย่าง "ฉันเกลียดสิ่งนี้เพราะ ... ในตุ๊กแก!" อินพุตของโมเดลจะเริ่มต้นด้วย "ฉันเกลียดสิ่งนี้" ซึ่งจะถูกส่งไปยังสถานะที่ซ่อนของโมเดลในบางรูปแบบ สถานะที่ซ่อนอยู่นี้ใช้เพื่อมีอิทธิพลต่อสถานะที่ซ่อนอยู่ในอนาคตของแบบจำลองดังนั้นแม้ว่าอาจจะมี 50 คำก่อนสิ้นสุดประโยค แต่สถานะที่ซ่อนอยู่จากคำเริ่มต้นเหล่านั้นมีโอกาสทางทฤษฎีของการมีอิทธิพลต่อผลผลิตแม้ว่ามันจะไม่เคย ได้รับการฝึกฝนในกลุ่มตัวอย่างที่มีระยะห่างระหว่าง "ฉันเกลียดสิ่งนี้" และจุดสิ้นสุดของประโยค