ปัญหาที่เกิดจากการไม่แก้ไขอคติ
ตามกระดาษ
ในกรณีที่มีการไล่ระดับสีแบบเบาบางสำหรับการประมาณช่วงเวลาที่สองที่เชื่อถือได้นั้นจำเป็นต้องเฉลี่ยมากกว่าการไล่ระดับสีจำนวนมากโดยการเลือกค่าเล็ก ๆ ของβ2; อย่างไรก็ตามมันเป็นกรณีของ small2 ขนาดเล็กที่ขาดการแก้ไขอคติเริ่มต้นจะนำไปสู่ขั้นตอนเริ่มต้นที่มีขนาดใหญ่กว่ามาก
โดยปกติแล้วในทางปฏิบัติจะถูกตั้งค่าให้ใกล้กับ 1 มากกว่า (ตามที่ผู้เขียนแนะนำ , ) ดังนั้นค่าสัมประสิทธิ์การอัปเดตนั้นเล็กกว่า .β2β1β2=0.999β1=0.91−β2=0.0011−β1=0.1
ในขั้นตอนแรกของการฝึกอบรม ,คำในการอัปเดตพารามิเตอร์อาจมีขนาดใหญ่มากหากเราใช้การประเมินแบบเอนเอียงโดยตรงm1=0.1gtv1=0.001g2tm1/(v1−−√+ϵ)
ในทางกลับกันเมื่อใช้การประมาณค่าที่แก้ไขโดยอคติและ ,คำศัพท์มีความไวต่อและกว่าm1^=g1v1^=g21mt^/(vt^−−√+ϵ)β1β2
วิธีแก้ปัญหาอคติ
อัลกอริทึมใช้ค่าเฉลี่ยเคลื่อนที่เพื่อประเมินช่วงเวลาแรกและช่วงเวลาที่สอง การประมาณลำเอียงจะเราเริ่มต้นที่เดาพลและอัปเดตการประเมินโดยค่อยๆm_ ดังนั้นจึงเป็นที่เห็นได้ชัดในไม่กี่ขั้นตอนแรกค่าเฉลี่ยเคลื่อนที่ของเราจะลำเอียงอย่างมากต่อการเริ่มต้นm_0m0mt=βmt−1+(1−β)gtm0
เพื่อแก้ไขสิ่งนี้เราสามารถลบผลกระทบของการเดาเริ่มต้น (อคติ) ออกจากค่าเฉลี่ยเคลื่อนที่ ตัวอย่างเช่นในเวลา 1,เราจะหาคำว่าจากและหารด้วยซึ่งให้ผลเบต้า) เมื่อ ,T) หลักฐานเต็มรูปแบบให้ไว้ในส่วนที่ 3 ของกระดาษm1=βm0+(1−β)gtβm0m1(1−β)m1^=(m1−βm0)/(1−β)m0=0mt^=mt/(1−βt)
ในฐานะที่เป็น Mark L. Stone มีความเห็นดี
มันเหมือนกับการคูณด้วย 2 (โอ้ฉันผลลัพธ์จะเอนเอียง) แล้วหารด้วย 2 เพื่อ "แก้ไข"
อย่างใดนี้ไม่เทียบเท่า
การไล่ระดับสี ณ จุดเริ่มต้นใช้สำหรับค่าเริ่มต้นของสิ่งเหล่านี้จากนั้นอัปเดตพารามิเตอร์แรก
(แน่นอนว่าสามารถเปลี่ยนเป็นรูปแบบเดียวกันได้โดยเปลี่ยนกฎการอัปเดต (ดูการอัปเดตคำตอบ) และฉันเชื่อว่าบรรทัดนี้มีจุดประสงค์หลักเพื่อแสดงความไม่จำเป็นในการแนะนำอคติ แต่อาจคุ้มค่าที่จะสังเกตเห็นความแตกต่าง)
ตัวอย่างเช่นช่วงเวลาแรกที่แก้ไขในเวลา 2
m2^=β(1−β)g1+(1−β)g21−β2=βg1+g2β+1
หากใช้เป็นค่าเริ่มต้นด้วยกฎการอัปเดตเดียวกัน
ซึ่งจะมีอคติต่อแทนในไม่กี่ขั้นตอนแรกg1m2=βg1+(1−β)g2
g1
การแก้ไขอคตินั้นเป็นเรื่องใหญ่
จริง ๆ เพราะมันมีผลกับการฝึกเพียงไม่กี่ขั้นตอนแรกเท่านั้นดูเหมือนว่าจะไม่เป็นปัญหาที่ใหญ่มากในกรอบการทำงานที่ได้รับความนิยมมากมาย (เช่นkeras , caffe ) เท่านั้นที่ใช้การประเมินแบบเอนเอียง
จากประสบการณ์ของฉันการประเมินแบบเอนเอียงบางครั้งนำไปสู่สถานการณ์ที่ไม่พึงประสงค์ซึ่งความสูญเสียจะไม่ลดลง (ฉันยังไม่ได้ทดสอบอย่างละเอียดดังนั้นฉันจึงไม่แน่ใจอย่างแน่นอนว่านี่เป็นเพราะการประเมินแบบเอนเอียงหรืออย่างอื่น) และเคล็ดลับ ที่ฉันใช้นั้นใช้ใหญ่กว่าเพื่อกลั่นกรองขั้นตอนเริ่มต้นϵ
อัปเดต
หากคุณเปิดเผยกฎการอัพเดทซ้ำโดยพื้นฐานเป็นค่าเฉลี่ยของการไล่ระดับสี
ตัวหารสามารถคำนวณได้โดยสูตรผลรวมทางเรขาคณิตดังนั้นจึงเท่ากับการอัปเดตต่อไปนี้ กฎ (ซึ่งไม่เกี่ยวข้องกับคำอคติ) m^t
m^t=βt−1g1+βt−2g2+...+gtβt−1+βt−2+...+1
m1←g1
ขณะที่ไม่มารวมกันทำ (ผลรวมถ่วงน้ำหนัก) (ถัวเฉลี่ยถ่วงน้ำหนัก)
mt←βmt+gt
m^t←(1−β)mt1−βt
ดังนั้นจึงสามารถทำได้โดยไม่ต้องแนะนำคำที่มีอคติและแก้ไขให้ถูกต้อง ฉันคิดว่ากระดาษวางไว้ในแบบฟอร์มการแก้ไขอคติเพื่อความสะดวกในการเปรียบเทียบกับอัลกอริทึมอื่น ๆ (เช่น RmsProp)