ฉันกำลังพยายามแก้ปัญหาการเพิ่มประสิทธิภาพแบบไม่เชิงเส้นที่ไม่มีข้อ จำกัด บน GPU (CUDA)
ฟังก์ชันวัตถุประสงค์เป็นฟังก์ชันที่ไม่เชิงเส้นอย่างราบรื่นและการไล่ระดับสีนั้นค่อนข้างถูกในการคำนวณเชิงวิเคราะห์ดังนั้นฉันไม่จำเป็นต้องกังวลกับการประมาณเชิงตัวเลข
ฉันต้องการที่จะแก้ปัญหานี้โดยส่วนใหญ่ fp32 maths ops (ด้วยเหตุผลต่าง ๆ ) ดังนั้นวิธีการเพิ่มประสิทธิภาพแบบไม่เชิงเส้นที่มีประสิทธิภาพมากขึ้นเมื่อเทียบกับข้อผิดพลาดในการปัดเศษขึ้นในขณะที่มีประสิทธิภาพที่ดี? (เช่นคอนจูเกตการไล่ระดับสี / เสมือนนิวตัน / ภูมิภาคที่เชื่อถือได้) มีใครเคยลองใช้ BFGS บน GPU ด้วยผลลัพธ์ที่ดีหรือไม่?
BTW, Hessian ถ้าจำเป็นมีขนาดค่อนข้างเล็กในกรณีของฉัน (โดยทั่วไป <64x64) แต่ฉันต้องแก้ปัญหาการเพิ่มประสิทธิภาพขนาดเล็กหลายพันรายการพร้อมกันนี้