คำถามเกี่ยวข้องกับหัวข้อนี้ ฉันต้องการได้รับสถานะคงที่ที่เป็นเอกลักษณ์สำหรับปัญหาการควบคุมที่ดีที่สุด
พิจารณาโปรแกรมต่อไปนี้
โดยที่หมายถึงการตั้งค่าเวลาคือค่าและฟังก์ชั่นวัตถุประสงค์ เป็นตัวแปรสถานะและตัวควบคุม รัฐถูกควบคุมโดยcdot) สมการแฮมิลตัน - จาโคปี - เบลล์แมนอ่าน
ส. t . V( x0) : = สูงสุดยู∫∞0อี- ρ tF( x ( t ) , u ( t ) ) dเสื้อx˙( t ) = f( x ( t ) , u ( t ) )x ( 0 ) = x0
V ( ⋅ ) F ( ⋅ ) x ∈ X u ∈ U = [ 0 , 1 ] f ( ⋅ ) ρ V ( x ) = สูงสุดu [ F ( x , u ) + V ′ ( x ) f ( x , u ) ] ,ρ > 0V( ⋅ )F( ⋅ )x∈Xu∈U=[0,1]f(⋅)ρV(x)=maxu[F(x,u)+V′(x)f(x,u)],∀t∈[0,∞)
ทีนี้ทึกทักเอาว่าการควบคุมการป้อนกลับถูกกำหนดโดย
u(x)=11+V′(x)=argmaxu[F(x,u)+V′(x)f(x,u)],∀x∈X.
สมมติว่ามีจุดคงที่ที่และเราสามารถได้รับการเป็นตัวแทนทางเลือกสำหรับการควบคุมที่ดีที่สุดในจุดคงที่ด้วย
x=x~
u(x~)=ρ+u′(x~)ρ+u′(x~)+1.
สมมติว่านอกจากนี้ HJB ในจุดคงที่จะได้รับโดย start
ρV(x)=ln(11+V′(x))+1−11+V′(x).
หาก approches ศูนย์เราจะต้องมี\ ในทางตรงกันข้ามถ้า Approches เราต้องมีโดยนิยามของฟังก์ชันตามตัวอักษรและอีกครั้ง1 สรุปเรามีคุณสมบัติดังต่อไปนี้ในสมดุล
ρ→0V′(x~)=0⇒u(x~)=1⇒u′(x~)=∞ρ→∞V(x~)=0V′(x~)=0⇒u(x~)=1
limρ→0u(x~)=limρ→∞u(x~)=1.
นั่นคือสิ่งที่ขัดแย้งกับ
∂u(x~)∂ρ=1(ρ+u′(x~)+1)2>0
เป็นฟังก์ชั่นที่เพิ่มขึ้นอย่างเคร่งครัด monoton ขัดแย้งกับผลลัพธ์ก่อนหน้าของเรา อย่างไรก็ตามโปรดทราบว่าเราอาจแก้ไขปัญหานี้ได้โดยการสังเกต
limu′(x~)→∞∂u(x~)∂ρ=0
ดังนั้นในที่สุดเราสามารถคาดเดาได้ว่าเราต้องอยู่ในจุดคงที่เช่นนั้น
u′(x~)=∞⇒u(x~)=1
ρV(x~)=ln(1)+1−1⇔V(x~)=0.