การแก้สมการแฮมิลตัน - จาโคบี - เบลล์แมน; จำเป็นและเพียงพอสำหรับการมองโลกในแง่ดี?


13

พิจารณาสมการเชิงอนุพันธ์ดังต่อไปนี้ โดยที่ คือสถานะและเป็นตัวแปรควบคุม โซลูชันได้รับจาก โดยที่เป็นสถานะ inital ที่กำหนดxUx(T)=x0+ T 0 F(x(s),U(s))ds x0:=x(0)

x˙(t)=f(x(t),u(t))
xu
x(t)=x0+0tf(x(s),u(s))ds.
x0:=x(0)

ตอนนี้ให้พิจารณาโปรแกรมต่อไปนี้

V(x0):=maxu0eρtF(x(t),u(t))dts.t. x˙(t)=f(x(t),u(t))x(0)=x0
โดยที่ρ>0หมายถึงการตั้งค่าเวลาV()คือค่าและF()ฟังก์ชั่นวัตถุประสงค์ แอปพลิเคชันทางเศรษฐกิจแบบคลาสสิกคือโมเดล Ramsey-Cass-Koopmans ของการเติบโตที่เหมาะสม สมการแฮมิลตัน - จาโคบี - เบลล์แมนกำหนดโดย
ρV(x)=maxu[F(x,u)+V(x)f(x,u)],t[0,).

ว่าฉันได้แก้ไข HJB สำหรับVแล้ว จากนั้นให้การควบคุมที่ดีที่สุดโดย

u=argmaxu[F(x,u)+V(x)f(x,u)].
ฉันจะได้รับลูกทีมที่ดีที่สุดสำหรับรัฐและควบคุม{(x(t),u(t)):t[0,)}\}

วิกิพีเดียบทความกล่าวว่า

... แต่เมื่อแก้ไขไปทั่วทั้งพื้นที่ของรัฐสมการ HJB เป็นเงื่อนไขที่จำเป็นและเพียงพอสำหรับการที่เหมาะสม

ใน Bertsekas (2005) การเขียนโปรแกรมแบบไดนามิกและการควบคุมที่เหมาะสมที่สุด Vol 1, 3rd ed. ในข้อเสนอ 3.2.1 เขาระบุว่าการแก้ปัญหาVเป็นฟังก์ชันต้นทุนที่เหมาะสมที่สุดและu ^ * ที่เกี่ยวข้องuนั้นเหมาะสมที่สุด อย่างไรก็ตามเขาประกาศอย่างชัดเจนว่าเป็นทฤษฎีบทความพอเพียง

ที่จริงแล้วฉันแค่ต้องการให้แน่ใจว่าถ้าฉันได้แก้ไข HJB และกู้คืนสถานะที่เกี่ยวข้องและเส้นทางการควบคุมที่ฉันไม่ต้องกังวลกับเงื่อนไขการเพิ่มประสิทธิภาพใด ๆ เพิ่มเติม

วิธีการแก้

ฉันพยายาม

ฉันคิดว่าฉันสามารถได้รับเงื่อนไขที่จำเป็นจากหลักการสูงสุดโดยสมการ HJB เอง

กำหนด hamiltonian start

H(x,u,V(x)):=F(x,u)+V(x)f(x,u)

จากนั้นเรามี

ρV(x)=maxuH(x,u,V(x))

ซึ่งคือ

ρV(x)=H(x,u,V(x)).

กำหนดโดยพลฟังก์ชั่นกับ 0 ตอนนี้แก้ไข q:[0,)Rq(0)=limtq(t)=0

x=x+εq

โดยที่เป็นพารามิเตอร์ เสียบคำศัพท์ลงใน hamiltonian ที่ขยายใหญ่สุดซึ่งให้ εR

ρV(x+εq)=H(x+εq,u,V(x+εq)).

ที่เรามีทางออกที่ดีที่สุด ดังนั้นจึงแตกต่างจากเพื่อรับเงื่อนไขการสั่งซื้อครั้งแรก ε=0ε

ρVq=Hxq+HVVq.

ตอนนี้กำหนดตัวแปร adjoint ด้วย

λ=V(x).

แยกความแตกต่างเมื่อเวลาผ่านไป

λ˙=Vx˙.

และโปรดทราบว่า

HV=f(x,u)=x˙.

เสียบทุกอย่างเข้ากับ foc ซึ่งจะให้

ρλ=Hx+λ˙.

นั่นมันสวยมาก ดังนั้นการแก้ไข HJB จึงเป็นสิ่งจำเป็นและเพียงพอ บางคนควรเพิ่มไว้ในวิกิ อาจช่วยประหยัดเวลาสำหรับผู้ที่คิดเกี่ยวกับปัญหาดังกล่าว (ฉันจะนับไม่ได้มาก)

อย่างไรก็ตามเงื่อนไขตามขวาง หายไป

limteρtλ(t)=0

II ความพยายาม

กำหนดฟังก์ชั่นการจ่ายผลตอบแทน

J(u):=0eρtF(x,u)dt

โปรดทราบว่า โดยคำนิยามของU) เพิ่มคำที่เป็นกลางให้กับส่วนผลตอบแทน start

0eρtλ[f(x,u)x˙]dt=0
x˙=f(x,u)
J(u)=0eρt[F(x,u)+λf(x,u)]dt0eρtλx˙dt=0eρtH(x,u,λ)0eρtλx˙dt

การบูรณาการโดยส่วนต่างๆของคำที่ถูกต้องบนผลตอบแทนที่ได้

0eρtλx˙dt=[eρtλ(t)x(t)]00eρtx(λ˙ρλ)dt

ใช้คำว่า start

J(u)=0eρt[H(x,u,λ)+x(λ˙ρλ)]dtlimteρtλ(t)x(t)+λ(0)x(0)

กำหนด

x=x+εqu=u+εp

ซึ่งให้

J(ε)=0eρt[H(x+εq,u+εp,λ)+(x+εq)(λ˙ρλ)]dtlimteρtλ(t)[x(t)+εq(t)]+λ(0)x(0)

FOC สำหรับสูงสุดJ ε = 0 E - ρ T [ H x Q + H U P + Q ( ˙ λ - ρ λ ) ] ตัน- ลิมที→การอี- ρ T λJε=0

Jε=0eρt[Hxq+Hup+q(λ˙ρλ)]dtlimteρtλ(t)q(t)=0

เนื่องจากและไม่มีข้อ จำกัด เราจะต้องมี qp

Hu=0Hx=ρλλ˙limteρtλ(t)=0

คุณระบุเงื่อนไขที่จำเป็นและเพียงพอแล้วหรือยัง
Jamzy

สิ่งนี้เกิดขึ้นในบริบททางเศรษฐกิจ
Stan Shunpike

แบบจำลอง Ramsey เช่นcer.ethz.ch/resec/people/tsteger/Ramsey_Model.pdf
clueless

1
ฉันคิดว่ากระทู้นี้เหมาะสำหรับmath.stackexchange.comเพราะไม่ได้เชื่อมโยงกับ econ จริงๆ ตัวดัดแปลงอาจถ่ายโอนได้
clueless

ฉันไม่แน่ใจว่ามีการถามอะไรที่นี่: หากการแก้ปัญหาของ Bertsekas HJB นั้นเพียงพอแล้วคุณไม่จำเป็นต้อง "กังวลเกี่ยวกับเงื่อนไขการเพิ่มประสิทธิภาพเพิ่มเติม" "เพียงพอเท่านั้น" กับ "จำเป็นและเพียงพอ" จะเกิดขึ้นในกรณีที่ HJB ไม่ได้รับการแก้ไข - ในกรณีที่ใครจะพูดว่า "นี่ไม่ได้หมายความว่าไม่มีวิธีแก้ปัญหา" อย่างไรก็ตามความพยายามของฉันและ II ของคุณเป็นเนื้อหาที่มีค่าที่นี่ - ครั้งแรกที่แสดงลิงค์ซึ่งมี HJB และการควบคุมที่เหมาะสมที่สุดเป็นครั้งแรก
Alecos Papadopoulos

คำตอบ:


1

(นี่อาจเป็นความเห็นที่ควรพิจารณา)

หากคุณได้แก้สมการ HJB แล้วก็เพียงพอที่จะได้รับทางออกที่ดีที่สุด ดังนั้นคุณไม่ต้อง "ต้องกังวลกับเงื่อนไขการเพิ่มประสิทธิภาพอื่น ๆ " ซึ่งฉันเชื่อว่าดูเหมือนจะตอบคำถามของคุณ

ดูเหมือนว่าคุณมีความกังวลเกี่ยวกับองค์ประกอบ "จำเป็น" ของทฤษฎีบท ด้านความจำเป็นของคำสั่งมีดังนี้: หากมีทางออกที่ดีที่สุดจะต้องมีวิธีการแก้สมการ HJB

ฉันไม่ได้ทำงานกับปัญหานี้โดยเฉพาะ แต่คำตอบโดยทั่วไปคือเราไม่คาดหวังว่าจะมีฟังก์ชั่น differentiable V ดังนั้นเราจึงไม่มีวิธีแก้สมการตามที่ระบุไว้ เราต้องดูอนุพันธ์ทั่วไปแล้วแปลงสมการ HJB เป็นความไม่เท่าเทียมกัน ในกรณีนี้คุณอาจได้รับ "ความหนืด" หากเราขยายการใช้อนุพันธ์ทั่วไปอาจเป็นไปได้ที่จะพิสูจน์ว่ามีวิธีแก้ปัญหาดังกล่าวอยู่เสมอ การพิสูจน์หลักฐานของคุณจะไม่ช่วยในเงื่อนไขที่จำเป็นตามที่คุณคาดเดาได้

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.