ดังที่ Jed Brown ได้กล่าวถึงการเชื่อมต่อระหว่างการไล่ระดับสีในการปรับให้เหมาะสมแบบไม่เชิงเส้นและการลดเวลาของระบบพลวัตถูกค้นพบอีกครั้งด้วยความถี่บางส่วน (เข้าใจได้เนื่องจากมันเป็นการเชื่อมต่อที่น่าพอใจมากกับจิตใจคณิตศาสตร์ อย่างไรก็ตามมันกลับกลายเป็นการเชื่อมต่อที่มีประโยชน์โดยเฉพาะอย่างยิ่งในบริบทที่คุณอธิบาย
ในปัญหาผกผันคนมีความสนใจในการแก้ไข (ไม่ดีถูกวาง) สมการประกอบกับไม่ได้อยู่ในช่วงของF(ปัญหาการควบคุมที่ดีที่สุดของคุณสามารถมองเห็นได้เป็นหนึ่งอินสแตนซ์ของมันด้วยและ .) กลยุทธ์การทำให้เป็นมาตรฐานหลายอย่าง (เช่น Tikhonov หรือ Landweber) สามารถตีความได้ว่าเป็นเวลาหลอกเดียว ขั้นตอนของคลาสที่แน่นอน ความคิดคือการใช้การตีความของพารามิเตอร์ normalization เป็นความยาวขั้นตอนเพื่อให้ได้กฎทางเลือก (adaptive, posteriori) บางตัวสำหรับพารามิเตอร์ - ปัญหาพื้นฐานในปัญหาผกผัน - และอาจทำให้หลายขั้นตอนเวลาหลอกเพื่อ เข้าหาทางออกที่แท้จริงและไม่สม่ำเสมอ (คล้ายกับF(u)=yδyδFF=A−1yδ=y0ความต่อเนื่องเชิงตัวเลข ) บางครั้งสิ่งนี้เรียกว่าการทำให้เป็นมาตรฐานอย่างต่อเนื่องและมักจะกล่าวถึงในบริบทของวิธีการตั้งค่าระดับ ตัวอย่างเช่นดูบทที่ 6.1 ของ Kaltenbacher, Scherzer, Neubauer: วิธีการทำให้เป็นมาตรฐานซ้ำสำหรับปัญหาไม่เชิงเส้น (de Gruyter, 2008)
บริบทที่สองแนวคิดนี้ซ้ำแล้วซ้ำอีกคือการปรับให้เหมาะสมแบบไม่เชิงเส้น: หากคุณดูขั้นตอนการไล่ระดับสีสำหรับ ,
จากนั้นคุณสามารถตีความสิ่งนี้เป็นขั้นตอนออยเลอร์ไปข้างหน้าสำหรับระบบพลวัต
ในขณะที่เจดบราวน์ชี้ให้เห็นสิ่งนี้ในแวบแรกให้ผลเพียงสังเกตไม่น่าแปลกใจมากที่วิธีนี้มาบรรจบกันหากขั้นตอนหลอกเวลามีขนาดเล็กพอ ส่วนที่น่าสนใจเกิดขึ้นเมื่อคุณดูระบบพลวัตและถามตัวเองว่าคุณสมบัติการแก้ปัญหาต่อเนื่องของการไหลแบบไล่ระดับสีที่เรียกว่าminxf(x)
xk+1=xk−γk∇f(xk),
x˙(t)=−∇f(x(t)),x(0)=x0.
γkx(t)มี (หรือควรมี) เป็นอิสระจากการสืบเชื้อสายการไล่ระดับสีและวิธีการที่อาจไม่นำไปสู่วิธีการที่เหมาะสมกว่าในการก้าวข้ามเวลา (และการเพิ่มประสิทธิภาพดังนั้น) กว่าวิธีมาตรฐานออยเลอร์ ตัวอย่างบางส่วนจากด้านบนของหัวของฉัน:
มีพื้นที่ฟังก์ชั่นตามธรรมชาติที่การไล่ระดับสีใช้หรือไม่ ถ้าเป็นเช่นนั้นขั้นตอนการไล่ระดับสีของคุณควรถูกนำมาจากพื้นที่เดียวกัน (เช่นการแยกส่วนควรจะสอดคล้อง) สิ่งนี้นำไปสู่เช่นการคำนวณ Riesz แทนการไล่ระดับสีด้วยความเคารพต่อผลิตภัณฑ์ภายในที่แตกต่างกัน (บางครั้งเรียกว่าการไล่ระดับสี Sobolev ) และในทางปฏิบัติเพื่อทำซ้ำเงื่อนไขที่รวมกันเร็วกว่ามาก
บางทีควรอยู่ไม่ปริภูมิเวกเตอร์ แต่นานา (เช่นสมมาตรเมทริกซ์ที่ชัดเจนในเชิงบวก) หรือการไหลของการไล่ระดับสีควรอนุรักษ์บรรทัดฐานหนึ่งของxในกรณีนี้คุณสามารถลองใช้แผนการประหยัดเวลาแบบอนุรักษ์โครงสร้าง (เช่นเกี่ยวข้องกับการดึงกลับในส่วนที่เกี่ยวกับกลุ่ม Lie ที่เหมาะสมหรือผู้รวบรวมทางเรขาคณิต)xx
ถ้าไม่สามารถหาอนุพันธ์ได้ แต่นูนขั้นตอนออยเลอร์ไปข้างหน้าสอดคล้องกับวิธีการสืบเชื้อสาย subgradient ซึ่งอาจช้ามากเนื่องจากข้อ จำกัด ขนาดขั้นตอน ในทางตรงกันข้ามขั้นตอนออยเลอร์โดยนัยสอดคล้องกับวิธีการจุดใกล้เคียงซึ่งไม่มีข้อ จำกัด ดังกล่าวใช้ (และซึ่งได้กลายเป็นที่นิยมมากในเช่นการประมวลผลภาพ)f
ในหลอดเลือดดำที่คล้ายกันวิธีการดังกล่าวสามารถเร่งได้อย่างมีนัยสำคัญโดยขั้นตอนการคาดการณ์ วิธีหนึ่งในการสร้างแรงจูงใจเหล่านี้คือการสังเกตว่าวิธีการสั่งซื้อแบบมาตรฐานอันดับแรกต้องประสบกับการทำขั้นตอนเล็ก ๆ น้อย ๆ ให้ใกล้กับ minimizers เพราะทิศทางการไล่ระดับสี "สั่น" (คิดว่าภาพประกอบมาตรฐานว่าทำไมคอนจูเกต เพื่อแก้ไขปัญหานี้เราสามารถ "ลด" การทำซ้ำโดยไม่แก้ไขระบบพลวัตลำดับที่หนึ่ง แต่ระบบลำดับที่สองที่ทำให้หมาด ๆ:
สำหรับการได้รับการแต่งตั้งอย่างเหมาะสมa_1,ด้วยการแยกส่วนที่เหมาะสมสิ่งนี้นำไปสู่การวนซ้ำ (เรียกว่าวิธีการลูกบอลหนักของ Polyak ) ของแบบฟอร์ม
a1x¨(t)+a2x˙(t)=−∇f(x(t))
a1,a2xk+1=xk−γk∇f(xk)+αk(xk−xk−1)
(พร้อมขึ้นอยู่กับ ) มีความคิดที่คล้ายกันสำหรับวิธีจุดใกล้เคียงดูเช่นกระดาษhttp://arxiv.org/pdf/1403.3522.pdfโดย Dirk Lorenz และ Thomas Pocka 1 , a 2γk,αka1,a2
(ฉันควรจะเพิ่มความรู้ลงไปในความรู้ของฉันในกรณีส่วนใหญ่การตีความในฐานะระบบพลวัตไม่จำเป็นอย่างยิ่งสำหรับการได้มาหรือการพิสูจน์การลู่เข้าของอัลกอริทึม; เราสามารถโต้แย้งความคิดเช่น จริง ๆ แล้วเป็นพื้นฐานมากกว่าระบบพลวัตหรือวิธีการไล่ระดับความลาดชันอย่างไรก็ตามมันไม่เคยเจ็บที่จะมีมุมมองอื่นที่จะมองปัญหาจาก)
แก้ไข:ฉันเพิ่งเจอตัวอย่างที่ยอดเยี่ยมจากบริบทที่สองซึ่งมีการใช้การตีความ ODE เพื่ออนุมานคุณสมบัติของวิธี Extragradient ของ Nesterov และแนะนำการปรับปรุง:
http://arxiv.org/pdf/1503.01243.pdf
(โปรดทราบว่านี่เป็นเช่นเดียวกัน ตัวอย่างของประเด็นของเจดบราวน์ซึ่งผู้เขียนได้ค้นพบประเด็นที่ 4 ข้างต้นอีกครั้งโดยไม่ทราบถึงอัลกอริทึมของ Polyak)
แก้ไข 2:และเป็นตัวบ่งชี้วิธีไกลคุณสามารถใช้เวลานี้ดูหน้า 5 ของhttp://arxiv.org/pdf/1509.03616v1.pdf