คำถามติดแท็ก dynamic-programming

3
เมื่อการควบคุมที่เหมาะสมล้มเหลว (?)
เพื่อที่จะ "ถามคำถามของฉัน" ฉันต้องแก้แบบจำลองก่อน ฉันจะข้ามบางขั้นตอนไป แต่สิ่งนี้จะทำให้โพสต์นี้นานมาก - นี่คือการทดสอบเพื่อดูว่าชุมชนนี้ชอบคำถามแบบนั้นหรือไม่ ก่อนที่จะเริ่มฉันชี้แจงว่าสิ่งนี้อาจดูเหมือนเป็นรูปแบบการเติบโตแบบนีโอคลาสสิกแบบมาตรฐานในเวลาต่อเนื่องแต่ไม่ใช่ : มันเกี่ยวข้องกับบุคคลเดียวซึ่งไม่ได้เป็น "ตัวแทน" ใครก็ตามในระบบเศรษฐกิจรอบตัวเขา ไม่ได้จำลอง กรอบงานที่นี่คือ"การประยุกต์ใช้การควบคุมที่เหมาะสมที่สุดกับปัญหาการขยายใหญ่สุดของบุคคลเดียว" นี่เป็นเรื่องเกี่ยวกับกรอบโซลูชันและวิธีการควบคุมที่เหมาะสมที่สุด เราแก้ปัญหาการเพิ่มประสิทธิภาพยูทิลิตี้ระหว่างกันของนักธุรกิจขนาดเล็กที่เป็นเจ้าของเงินทุนใน บริษัท ของเขาในขณะที่เขาซื้อบริการด้านแรงงานในตลาดแรงงานที่มีการแข่งขันสูงและเขาขายผลิตภัณฑ์ของเขา (โดนัทสด) ในตลาดสินค้าที่แข่งขันได้อย่างสมบูรณ์ เรากำหนดรูปแบบในเวลาต่อเนื่องโดยไม่มีความไม่แน่นอน (เงื่อนไขทางสังคมและเศรษฐกิจมีความมั่นคง) และด้วยขอบฟ้าที่ไม่มีที่สิ้นสุด maxc,ℓ,k∫∞0e−ρtlncdts.t.k˙=f(k,ℓ)−wℓ−δk−climt→∞e−ρtλ(t)k(t)=0maxc,ℓ,k∫0∞e−ρtln⁡cdts.t.k˙=f(k,ℓ)−wℓ−δk−climt→∞e−ρtλ(t)k(t)=0\max_{c,\ell,k}\int_0^{\infty}e^{-\rho t}\ln c\,\text{d}t\\ \text{s.t.}\;\; \dot k = f(k,\ell) - w\ell - \delta k - c\\ \lim_{t\rightarrow \infty}e^{-\rho t}\lambda(t) k(t) = 0 ที่cccคือการบริโภคของนักธุรกิจlncln⁡c\ln cเป็นประโยชน์จากการบริโภคทันทีρ>0ρ>0\rho>0คืออัตราการกำหนดเวลาบริสุทธิ์kkkคือเมืองหลวงของ บริษัทδδ\deltaคืออัตราค่าเสื่อมราคาทุนและf(k,ℓ)f(k,ℓ)f(k,\ell)เป็นฟังก์ชั่นการผลิตของธุรกิจ ระดับเริ่มต้นของเงินทุนจะได้รับk_0k0k0k_0อาชีพของนักธุรกิจที่มีธุรกิจเป็นเงินทุน ฟังก์ชั่นการผลิตเป็นมาตรฐานนีโอคลาสสิก (ผลตอบแทนคงที่ขนาดผลิตภัณฑ์ส่วนเพิ่มบวกส่วนที่สองเชิงลบเงื่อนไข …

1
การแก้สมการแฮมิลตัน - จาโคบี - เบลล์แมน; จำเป็นและเพียงพอสำหรับการมองโลกในแง่ดี?
พิจารณาสมการเชิงอนุพันธ์ดังต่อไปนี้ โดยที่ คือสถานะและเป็นตัวแปรควบคุม โซลูชันได้รับจาก โดยที่เป็นสถานะ inital ที่กำหนดxUx(T)=x0+∫ T 0 F(x(s),U(s))ds x0:=x(0)x˙(t)=f(x(t),u(t))x˙(t)=f(x(t),u(t))\begin{align} \dot x(t)=f(x(t),u(t)) \end{align}xxxuuux(t)=x0+∫t0f(x(s),u(s))ds.x(t)=x0+∫0tf(x(s),u(s))ds.\begin{align} x(t)=x_0 + \int^t_0f(x(s),u(s))ds. \end{align}x0:=x(0)x0:=x(0)x_0:=x(0) ตอนนี้ให้พิจารณาโปรแกรมต่อไปนี้ s.t. V(x0):=maxu∫∞0e−ρtF(x(t),u(t))dtx˙(t)=f(x(t),u(t))x(0)=x0V(x0):=maxu∫0∞e−ρtF(x(t),u(t))dts.t. x˙(t)=f(x(t),u(t))x(0)=x0\begin{align} &V(x_0) := \max_u \int^\infty_0 e^{-\rho t}F(x(t),u(t))dt\\ s.t.~&\dot x(t)=f(x(t),u(t))\\ &x(0) = x_0 \end{align} โดยที่ρ>0ρ>0\rho > 0หมายถึงการตั้งค่าเวลาV(⋅)V(⋅)V(\cdot)คือค่าและF(⋅)F(⋅)F(\cdot)ฟังก์ชั่นวัตถุประสงค์ แอปพลิเคชันทางเศรษฐกิจแบบคลาสสิกคือโมเดล Ramsey-Cass-Koopmans ของการเติบโตที่เหมาะสม สมการแฮมิลตัน - จาโคบี - เบลล์แมนกำหนดโดย ρV(x)=maxu[F(x,u)+V′(x)f(x,u)],∀t∈[0,∞).ρV(x)=maxu[F(x,u)+V′(x)f(x,u)],∀t∈[0,∞).\begin{align} \rho V(x)=\max_u [F(x,u) + …

6
การอ้างอิงเพื่อเรียนรู้การเขียนโปรแกรมแบบไดนามิกอย่างต่อเนื่อง
ไม่มีใครทราบการอ้างอิงที่ดีเพื่อเรียนรู้การเขียนโปรแกรมแบบไดนามิกอย่างต่อเนื่องหรือไม่ การอ้างอิงไม่จำเป็นต้องเป็นหนังสือ พวกเขาสามารถเชื่อมโยงไปยังแหล่งข้อมูลออนไลน์เช่นกัน ลิงก์ไปยังการสนทนาที่ชัดเจนและกระชับแม้เพียงแค่พื้นฐานก็มีประโยชน์

1
เดาและตรวจสอบ
ในการเขียนโปรแกรมแบบไดนามิกวิธีการของค่าสัมประสิทธิ์บึกบึนบางครั้งเรียกว่า "เดาและตรวจสอบ" ฉันได้ยินมาเป็นระยะ ๆ ว่าอาจมีผู้อื่นยอมรับได้ โดยเฉพาะอย่างยิ่งฉันเคยเห็น V(k)=A+Bln(k)V(k)=A+Bln⁡(k)V(k) = A + B\ln(k) V(k)=Bk1−σ1−σV(k)=Bk1−σ1−σV(k) = \frac{Bk^{1-\sigma}}{1-\sigma} อดีตนำไปใช้กับยูทิลิตี้การบันทึกในขณะที่หลังเกี่ยวข้องกับการตั้งค่า CRRA มีการคาดเดาแบบบัญญัติอะไรอีกและมักเชื่อมโยงกับรูปแบบเฉพาะของฟังก์ชันส่งคืนหรือไม่ แก้ไข : สำหรับผู้ที่ไม่คุ้นเคยกับโปรแกรมแบบไดนามิกสิ่งที่เราพยายามทำที่นี่มาพร้อมกับรูปแบบปิดสำหรับค่าสัมประสิทธิ์ ( เช่น และ ) ในการทำให้ง่ายกว่าปกติสมการการทำงานจะใช้รูปแบบทั่วไปซึ่งกรัม (\ cdot \ cdot)อธิบายวิวัฒนาการของรัฐตัวแปรk หลักความคุ้มค่าของการอยู่ในรัฐkวันนี้ขึ้นอยู่กับฟังก์ชั่นการกลับมาของวันนี้F (K, U)และบางส่วนลดค่าของสิ่งที่kเป็นไปได้ในวันพรุ่งนี้\ beta v \ bigl (g (k, U) \ bigr) ยูAAABBBV(k)=max{F(k,u)+βV(g(k,u))}V(k)=max{F(k,u)+βV(g(k,u))}V(k) = \max\bigl\{F(k,u) +\beta V\bigl(g(k,u)\bigr)\bigr\}g(⋅,⋅)g(⋅,⋅)g(\cdot,\cdot)kkkkkkF(k,u)F(k,u)F(k,u)kkkβV(g(k,u))βV(g(k,u))\beta V\bigl(g(k,u)\bigr)uuu แสดงถึงตัวแปรอื่น ๆ ที่ไม่ใช่ของรัฐที่คุณคิดว่ามีอิทธิพลต่อผลตอบแทน …

1
การคาดคะเนสถานะคงที่จากคุณสมบัติการ จำกัด
คำถามเกี่ยวข้องกับหัวข้อนี้ ฉันต้องการได้รับสถานะคงที่ที่เป็นเอกลักษณ์สำหรับปัญหาการควบคุมที่ดีที่สุด พิจารณาโปรแกรมต่อไปนี้ โดยที่หมายถึงการตั้งค่าเวลาคือค่าและฟังก์ชั่นวัตถุประสงค์ เป็นตัวแปรสถานะและตัวควบคุม รัฐถูกควบคุมโดยcdot) สมการแฮมิลตัน - จาโคปี - เบลล์แมนอ่าน ส. t . V( x0) : = สูงสุดยู∫∞0อี- ρ tF( x ( t ) , u ( t ) ) dเสื้อx˙( t ) = f( x ( t ) , u ( t ) )x ( 0 ) = …
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.