การคาดคะเนสถานะคงที่จากคุณสมบัติการ จำกัด


3

คำถามเกี่ยวข้องกับหัวข้อนี้ ฉันต้องการได้รับสถานะคงที่ที่เป็นเอกลักษณ์สำหรับปัญหาการควบคุมที่ดีที่สุด

พิจารณาโปรแกรมต่อไปนี้ โดยที่หมายถึงการตั้งค่าเวลาคือค่าและฟังก์ชั่นวัตถุประสงค์ เป็นตัวแปรสถานะและตัวควบคุม รัฐถูกควบคุมโดยcdot) สมการแฮมิลตัน - จาโคปี - เบลล์แมนอ่าน

V(x0):=maxu0eρtF(x(t),u(t))dts.t. x˙(t)=f(x(t),u(t))x(0)=x0
V ( ) F ( ) x X u U = [ 0 , 1 ] f ( ) ρ V ( x ) = สูงสุดu [ F ( x , u ) + V ( x ) f ( x , u ) ] ,ρ>0V()F()xXuU=[0,1]f()
ρV(x)=maxu[F(x,u)+V(x)f(x,u)],t[0,)

ทีนี้ทึกทักเอาว่าการควบคุมการป้อนกลับถูกกำหนดโดย

u(x)=11+V(x)=argmaxu[F(x,u)+V(x)f(x,u)],xX.

สมมติว่ามีจุดคงที่ที่และเราสามารถได้รับการเป็นตัวแทนทางเลือกสำหรับการควบคุมที่ดีที่สุดในจุดคงที่ด้วย x=x~

u(x~)=ρ+u(x~)ρ+u(x~)+1.

สมมติว่านอกจากนี้ HJB ในจุดคงที่จะได้รับโดย start

ρV(x)=ln(11+V(x))+111+V(x).

หาก approches ศูนย์เราจะต้องมี\ ในทางตรงกันข้ามถ้า Approches เราต้องมีโดยนิยามของฟังก์ชันตามตัวอักษรและอีกครั้ง1 สรุปเรามีคุณสมบัติดังต่อไปนี้ในสมดุล ρ0V(x~)=0u(x~)=1u(x~)=ρV(x~)=0V(x~)=0u(x~)=1

limρ0u(x~)=limρu(x~)=1.

นั่นคือสิ่งที่ขัดแย้งกับ

u(x~)ρ=1(ρ+u(x~)+1)2>0

เป็นฟังก์ชั่นที่เพิ่มขึ้นอย่างเคร่งครัด monoton ขัดแย้งกับผลลัพธ์ก่อนหน้าของเรา อย่างไรก็ตามโปรดทราบว่าเราอาจแก้ไขปัญหานี้ได้โดยการสังเกต

limu(x~)u(x~)ρ=0

ดังนั้นในที่สุดเราสามารถคาดเดาได้ว่าเราต้องอยู่ในจุดคงที่เช่นนั้น u(x~)=u(x~)=1

ρV(x~)=ln(1)+11V(x~)=0.

ฉันไม่แน่ใจว่าคุณจะมาถึงสีหน้าของu(x~)ρ
Alecos Papadopoulos

คุณถูก. ฉันคิดว่ามันควรอ่าน:ที่สัญญาณไม่ได้กำหนดและการโต้แย้งของฉันมีข้อบกพร่อง u(x~)/ρ=(1+u(x~)/ρ)/(ρ+u(x~)+1)2
clueless

เราจะดำเนินการต่อไปอย่างไร ฉันควรโพสต์สิ่งนี้เป็นคำตอบ "ผลลบ" เพื่อไม่ให้โพสต์ยังคงอยู่ในคิวที่ยังไม่ได้ตอบหรือคุณจะแก้ไขคำถามอย่างใดอย่างหนึ่งหรือไม่?
Alecos Papadopoulos

อาจเป็นผลลบทำให้ฉันไม่รู้ว่าจะแก้ไขปัญหาอย่างไร ฉันคิดว่าฉันได้พบวิธีที่แตกต่างเพื่อแสดงให้เห็นว่าเป็น equlibrium ที่เสถียรที่เกี่ยวข้องกับค่าสูงสุดเนื่องจากตามหลักการเบี่ยงเบน shot เดียวไม่มีแรงจูงใจที่จะเบี่ยงเบนจากกลยุทธ์เฉพาะนั้น อย่างไรก็ตามการตั้งค่าเริ่มต้นของฉันเกี่ยวข้องกับตัวแทนสองรายซึ่งแตกต่างจากที่เสนอไว้ที่นี่ u(x~)=1
clueless

คำตอบ:


1

การอัพเกรดการแลกเปลี่ยนความคิดเห็นจุดวิกฤติในคำถามคือนิพจน์

u(x~)ρ=1(ρ+u(x~)+1)2

ซึ่งผิดพลาดเพราะจาก

u(x~)=ρ+u(x~)ρ+u(x~)+1.

เราได้รับ

u(x~)ρ=1+u(x~)/ρ(ρ+u(x~)+1)2

OP ตั้งข้อสังเกตว่าสัญลักษณ์ของไม่แน่นอนและไม่สามารถพูดได้ว่าเพิ่มขึ้นซ้ำซากจำเจซึ่งเป็นสิ่งที่ ขับรถปักหมุดของรัฐที่มั่นคงU ( ~ x ) /ρu(x~)/ρu(x~)/ρ

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.