ความไวของ BFGS ถึงการประมาณค่าเริ่มต้นของ Hessian


9

ฉันพยายามใช้วิธี Broyden-Fletcher-Goldfarb-Shanno เพื่อค้นหาฟังก์ชันขั้นต่ำ ฉันต้องการการเดาเริ่มต้นสองครั้งx1 & x0 และการประมาณค่าเริ่มต้นของ Hessian Matrix B0. ข้อกำหนดเฉพาะที่ฉันค้นหาB0 คือถ้า Hessian เป็นสมมาตรเชิงบวกแน่นอนก็ควรเช่นกัน B0. เมื่อมองไปที่วิกิพีเดียฉันเห็นว่าการประมาณเบื้องต้นเบื้องต้นคือB0=I(เมทริกซ์เอกลักษณ์) นี่เป็นครั้งแรกที่ดีเสมอB0? มีเหตุผลใดบ้างที่ฉันอาจต้องการเลือกสิ่งอื่นนอกเหนือจากนี้I? ตัวเลือกอื่น ๆ ของ B ซึ่งจะทำให้คุณสมบัติเมทริกซ์เดียวกันเป็นที่น่าพอใจมีผลกระทบอย่างมากต่อการรวมกันของวิธีการนี้หรือไม่?

คำตอบ:


6

หากคุณมีการประเมินแบบ Hessian อย่างเป็นธรรมจะดีกว่าที่จะใช้มันแทนการใช้โดยพลการ B0=I.

แก้ไข: เหตุผลคือถ้าคุณเริ่มใกล้กับโซลูชัน xอัตราเริ่มต้นของการบรรจบกันคือ (สำหรับใด ๆ ) r>0) r+1- ขั้นตอนเชิงเส้นด้วย r+1ขั้นตอนการบรรจบกันของ q=B01f(x)Gถ้านี่คือสำหรับการจัดอันดับการแก้ไขของเมทริกซ์เอกลักษณ์ ดังนั้นการพยายามทำให้สิ่งเล็ก ๆ นี้มีค่ามาก (สิ่งนี้เทียบเท่ากับการปรับสภาพระบบล่วงหน้า) ปัจจัยการลู่เข้าจะปรับปรุงให้ดีขึ้นตามเวลาและในที่สุดก็เข้าใกล้ศูนย์ (การบรรจบกันแบบ Superlinear) แต่ในปัญหาที่แท้จริงหลายประการ ดังนั้นความเร็วเริ่มต้นจึงค่อนข้างสำคัญ<1rG

กรณีที่สำคัญอย่างหนึ่งคือเมื่อแก้ไขปัญหากำลังสองน้อยที่สุด (ลด ) ซึ่งการประมาณ Gauss-Newtonของ Hessian เริ่มต้น คำนวณโดยไม่จำเป็นต้องมีอนุพันธ์อันดับสอง การใช้มันทำให้วิธีการ BFGS เลียนแบบค่าคงที่คือค่าคงที่ภายใต้การแปลงเชิงเส้นของเช่นวิธีของนิวตันซึ่งมักจะเป็นประโยชน์มากF(x)22B0=F(x0)TF(x0)x

อีกกรณีที่สำคัญคือเมื่อคุณแก้ไขลำดับของปัญหาที่เกี่ยวข้อง บ่อยครั้งที่การเริ่มต้นตัวแก้ปัญหาใหม่ด้วยการประเมิน Hessian ขั้นสุดท้ายของปัญหาก่อนหน้านี้ช่วยลดจำนวนการทำซ้ำที่จำเป็นลงอย่างมาก


หากคาดว่าจะเป็นสมมาตรบวกแน่นอนเมทริกซ์แน่นอนบวกใด ๆ สมมาตรจะยังคงนำไปสู่การบรรจบกัน แต่อัตราการบรรจบกันขึ้นอยู่กับว่าคล้ายกับรัฐเฮสเซียนมากน้อยเพียงใด? B0B0
เปาโล

ไม่ในที่สุด BFGS ลืมเกี่ยวกับเมทริกซ์เริ่มต้นดังนั้นการลู่เข้าที่มีลำดับเดียวกันเสมอ แต่แน่นอนว่าไม่น่าสนใจเพราะคุณไม่เคยทำหลายขั้นตอนอย่างไร้ขีด จำกัด k
Wolfgang Bangerth

@Paul: ดูการแก้ไขของฉัน
Arnold Neumaier
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.