คำว่าโมเมนตัมสำหรับอัลกอริธึม backpropagation ทำงานอย่างไร


9

เมื่ออัปเดตน้ำหนักของเครือข่ายนิวรัลโดยใช้อัลกอริธึม backpropagation กับโมเมนตัมอัตราการเรียนรู้ควรถูกนำไปใช้กับเทอมโมเมนตัมเช่นกันหรือไม่?

ข้อมูลส่วนใหญ่ที่ฉันพบเกี่ยวกับการใช้โมเมนตัมมีสมการที่มีลักษณะดังนี้:

Wi=WiαΔWi+μΔWi1

โดยที่คืออัตราการเรียนรู้และคือศัพท์โมเมนตัมαμ

หากคำว่ามีขนาดใหญ่กว่าคำว่าดังนั้นในการทำซ้ำครั้งถัดไปจากการทำซ้ำครั้งก่อนหน้าจะมีผลต่อน้ำหนักมากกว่าที่เป็นอยู่ในปัจจุบันμαΔW

นี่คือจุดประสงค์ของคำว่าโมเมนตัมหรือไม่? หรือสมการควรมีลักษณะเช่นนี้มากกว่านี้หรือไม่

Wi=Wiα(ΔWi+μΔWi1)

กล่าวคือ ปรับขนาดทุกอย่างตามอัตราการเรียนรู้?

คำตอบ:


10

การใช้ Backpropagation พร้อมโมเมนตัมในเครือข่ายที่มีน้ำหนักที่แตกต่างกันการแก้ไข -th สำหรับน้ำหนักนั้นได้รับจากnWkiWk

ΔWk(i)=αEWk+μΔWk(i1) โดยที่คือการเปลี่ยนแปลงของ การสูญเสีย WRT W_kEWkWk

การแนะนำของอัตราโมเมนตัมช่วยให้การลดทอนของความผันผวนในการไล่ระดับสี แนวคิดทางเรขาคณิตที่อยู่เบื้องหลังความคิดนี้สามารถเข้าใจได้ดีที่สุดในแง่ของการวิเคราะห์ eigenspace ในกรณีเชิงเส้น หากอัตราส่วนระหว่างค่าลักษณะเฉพาะต่ำสุดและใหญ่ที่สุดนั้นมีขนาดใหญ่แล้วการดำเนินการลดความลาดชันจะช้าแม้ว่าอัตราการเรียนรู้จะสูงเนื่องจากการปรับเมทริกซ์ โมเมนตัมแนะนำการทรงตัวบางอย่างในการอัพเดทระหว่างไอเก็นผู้ประกอบการที่เกี่ยวข้องกับค่าลักษณะเฉพาะที่ต่ำกว่าและใหญ่กว่า

สำหรับรายละเอียดเพิ่มเติมฉันหมายถึง

http://page.mi.fu-berlin.de/rojas/neural/chapter/K8.pdf


Underbrace มีความหมายอะไร?
David Richerby

ตกลงดังนั้นคำว่าโมเมนตัมจึงถูกรวมเข้าด้วยกันเมื่อทำการคำนวณคำแทนที่จะเพิ่มเมื่อทำการคำนวณค่าน้ำหนัก "ใหม่" เพื่ออธิบายให้ชัดเจนเทอมของคุณควรเป็นหรือไม่ หรือเป็นสัดส่วนของน้ำหนักจริงมากกว่าการเปลี่ยนแปลงอัตรา? ขอบคุณสำหรับคำตอบของคุณและสำหรับลิงค์ไปยังกระดาษ ΔWkμWk(i1)μΔWk(i1)
guskenny83

ขอบคุณสำหรับการชี้ให้เห็นข้อผิดพลาด มันเป็นของหลักสูตรΔWk(i1)
นิโก้

คุณหมายถึงอะไรโดย "รูปแบบของการสูญเสีย"? นั่นคือ "การเปลี่ยนแปลงในข้อผิดพลาด" หรือไม่?
starbeamrainbowlabs

มันไม่มีความหมายอะไรนอกจากอนุพันธ์ของข้อผิดพลาดเกี่ยวกับน้ำหนัก
โก้
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.