สมมติว่าการฟื้นฟูข้อมูลที่สมเหตุสมผลอย่างเป็นธรรมความคาดหวังของน้ำหนักควรเป็นศูนย์หรือใกล้เคียง มันอาจจะสมเหตุสมผลในการกำหนดน้ำหนักเริ่มต้นทั้งหมดให้เป็นศูนย์เพราะน้ำหนักเริ่มต้นบวกจะต้องดำเนินต่อไปถ้ามันควรจะเป็นน้ำหนักเชิงลบและวีซ่าในทางกลับกัน อย่างไรก็ตามสิ่งนี้ไม่ทำงาน หากน้ำหนักทั้งหมดเท่ากันพวกเขาทั้งหมดจะมีข้อผิดพลาดเดียวกันและตัวแบบจะไม่เรียนรู้อะไรเลย - ไม่มีแหล่งที่มาของความไม่สมดุลระหว่างเซลล์ประสาท
สิ่งที่เราสามารถทำได้แทนคือให้น้ำหนักใกล้เคียงกับศูนย์มากที่สุด แต่ทำให้น้ำหนักแตกต่างกันโดยการกำหนดค่าเริ่มต้นให้เป็นตัวเลขขนาดเล็กและไม่เป็นศูนย์ นี่คือสิ่งที่แนะนำในบทช่วยสอนที่คุณเชื่อมโยง มันมีข้อได้เปรียบเหมือนกันของการเริ่มต้นทั้งหมดเป็นศูนย์ซึ่งใกล้เคียงกับค่าคาดหวังที่ 'คาดเดาได้ดีที่สุด' แต่สมมาตรก็แตกหักพอสำหรับอัลกอริทึมในการทำงาน
วิธีนี้มีปัญหาเพิ่มเติม ไม่จำเป็นต้องเป็นความจริงที่ว่าจำนวนที่น้อยกว่าจะทำงานได้ดีขึ้นโดยเฉพาะอย่างยิ่งถ้าโครงข่ายประสาทเทียมนั้นลึก การไล่ระดับสีที่คำนวณใน backpropagation เป็นสัดส่วนกับน้ำหนัก น้ำหนักที่น้อยมากนำไปสู่การไล่ระดับสีที่เล็กมากและสามารถนำไปสู่เครือข่ายที่ใช้เวลานานในการฝึกฝนหรือไม่สำเร็จ
ปัญหาที่อาจเกิดขึ้นก็คือการกระจายของผลลัพธ์ของแต่ละเซลล์ประสาทเมื่อใช้ค่าเริ่มต้นแบบสุ่มมีความแปรปรวนที่ใหญ่ขึ้นด้วยอินพุตที่มากขึ้น ขั้นตอนเพิ่มเติมทั่วไปคือการทำให้ความแปรปรวนของนิวรอนเอาท์พุทเป็น 1 โดยการหารน้ำหนักของมันด้วยโดยที่คือจำนวนของอินพุตไปยังเซลล์ประสาท น้ำหนักที่ได้จะกระจายไปตามปกติระหว่างsqrt(d)d[−1d√,1d√]