เหตุใดความน่าจะเป็นในตัวกรองคาลมานจึงคำนวณโดยใช้ผลลัพธ์ตัวกรองแทนผลลัพธ์ที่ราบรื่นกว่า


11

ฉันใช้ตัวกรองคาลมานในแบบมาตรฐานมาก ระบบจะแสดงโดยสมรัฐและสมการสังเกต{t}xเสื้อ+1=Fxเสื้อ+โวลต์เสื้อ+1Yเสื้อ=Hxเสื้อ+AZเสื้อ+Wเสื้อ

ตำราสอนว่าหลังจากใช้ตัวกรองคาลมานแล้วรับ "การคาดการณ์หนึ่งขั้นตอนล่วงหน้า" (หรือ "การประเมินที่กรองแล้ว") เราควรใช้พวกมันเพื่อคำนวณฟังก์ชันโอกาส:x^เสื้อ|เสื้อ-1

Yเสื้อ|ผมเสื้อ-1,Zเสื้อ(Yเสื้อ|ผมเสื้อ-1,Zเสื้อ)=เดชอุดม[2π(HPเสื้อ|เสื้อ-1H'+R)]-12ประสบการณ์{-12(Yเสื้อ-Hx^เสื้อ|เสื้อ-1-AZเสื้อ)'(HPเสื้อ|เสื้อ-1H'+R)-1(Yเสื้อ-Hx^เสื้อ|เสื้อ-1-AZเสื้อ)}

คำถามของฉันคือ: เพราะเหตุใดฟังก์ชันความน่าจะเป็นที่คำนวณโดยใช้ "ตัวกรองการประมาณ" x^เสื้อ|เสื้อ-1และไม่ใช่ "การประมาณแบบราบรื่น" x^เสื้อ|T ? ไม่ได้x^เสื้อ|Tประมาณการที่ดีขึ้นของเวกเตอร์ของรัฐหรือไม่


ฉันแก้ไขชื่อเพื่อให้ข้อมูลเพิ่มเติม
Juho Kokkala

คำตอบ:


5

เพื่อตอบคำถามของคุณ: คุณสามารถใช้ความหนาแน่นที่ปรับให้เรียบ แต่คุณไม่จำเป็นต้อง คำตอบของ Jarle Tufto มีการสลายตัวที่คุณใช้ แต่มีคนอื่น

ใช้การเรียกซ้ำคาลมาน

ที่นี่คุณกำลังประเมินโอกาสในการเป็น

(Y1,...,Yn)=(Y1)Πผม=2n(Yผม|Y1,...,Yผม-1).

อย่างไรก็ตามค่าเฉลี่ยและความแปรปรวนไม่ได้กำหนดการแจกแจงความน่าจะเป็นโดยทั่วไปเสมอไป ต่อไปนี้คือการสลายตัวที่คุณใช้เพื่อไปจากการกรองการแจกแจงไปยังความน่าจะเป็นตามเงื่อนไข :f ( y i | y 1 , , y i - 1 )(xผม-1|Y1,...,Yผม-1)(Yผม|Y1,...,Yผม-1)

(1)(Yผม|Y1,...,Yผม-1)=(Yผม|xผม)(xผม|xผม-1)(xผม-1|Y1,...,Yผม-1)dxผมdxผม-1.

นี่คือ คือความหนาแน่นการเปลี่ยนสถานะ ... ส่วนหนึ่งของแบบจำลองและคือความหนาแน่นของการสังเกต ... ส่วนหนึ่งของแบบจำลองอีกครั้ง ในคำถามของคุณคุณเขียนเป็นและตามลำดับ มันเป็นสิ่งเดียวกันf ( y i | x i ) x t + 1 = F x t + v t + 1 y t = H x t + A z t + w t(xผม|xผม-1)(Yผม|xผม)xเสื้อ+1=Fxเสื้อ+โวลต์เสื้อ+1Yเสื้อ=Hxเสื้อ+AZเสื้อ+Wเสื้อ

เมื่อคุณได้รับการกระจายสถานะล่วงหน้าล่วงหน้าหนึ่งขั้นนั่นคือการคำนวณ-1} เมื่อคุณรวมอีกครั้งคุณจะได้รับ (1) อย่างสมบูรณ์ คุณเขียนความหนาแน่นนั้นออกมาอย่างสมบูรณ์ในคำถามของคุณและมันก็เป็นสิ่งเดียวกัน(xผม|xผม-1)(xผม-1|Y1,...,Yผม-1)dxผม-1

ที่นี่คุณจะใช้การสลายตัวของการแจกแจงความน่าจะเป็นและสมมติฐานเกี่ยวกับตัวแบบ การคำนวณความน่าจะเป็นเป็นการคำนวณที่แน่นอน ไม่มีสิ่งใดที่คุณสามารถใช้เพื่อทำสิ่งนี้ให้ดีขึ้นหรือแย่ลง

การใช้อัลกอริทึม EM

สำหรับความรู้ของฉันไม่มีวิธีอื่นในการประเมินความน่าจะเป็นโดยตรงในรูปแบบพื้นที่ของรัฐนี้ อย่างไรก็ตามคุณยังสามารถทำการประเมินความเป็นไปได้สูงสุดโดยการประเมินฟังก์ชั่นที่แตกต่าง: คุณสามารถใช้อัลกอริทึม EM ในขั้นตอนที่คาดหวัง (ขั้นตอน E) คุณจะคำนวณ ที่นี่

f(x1,...,xn|Y1,...Yn)เข้าสู่ระบบ(Y1,...,Yn,x1,...,xn)dx1:n=Esม.โอโอเสื้อชั่วโมง[เข้าสู่ระบบ(Y1,...,Yn,x1,...,xn)].
(Y1,...,Yn,x1,...,xn)เป็นโอกาสในการ "ข้อมูลที่สมบูรณ์" และคุณคาดหวังว่าจะมีการบันทึกที่เกี่ยวข้องกับความหนาแน่นของข้อต่อที่ราบเรียบ สิ่งที่มักจะเกิดขึ้นก็คือเนื่องจากคุณกำลังบันทึกข้อมูลความน่าจะเป็นของข้อมูลที่สมบูรณ์คำศัพท์แบ่งออกเป็นผลรวมและเนื่องจากความเป็นเส้นตรงของผู้ดำเนินการคาดการณ์คุณจะรับความคาดหวังเกี่ยวกับการแจกแจงที่ราบเรียบเล็กน้อย คุณพูดถึงคำถามของคุณ)

สิ่งอื่น ๆ

ฉันได้อ่านในสถานที่ที่ EM เป็นวิธี "มีเสถียรภาพมากขึ้น" เพื่อเพิ่มโอกาส แต่ฉันไม่เคยเห็นจุดนี้ถกเถียงกันดีจริงๆและฉันไม่เคยเห็นคำว่า "เสถียร" นี้เลย ไม่ได้ตรวจสอบเรื่องนี้อีก อัลกอริธึมเหล่านี้ไม่ได้รับการทดสอบระดับท้องถิ่น / ระดับโลก โดยส่วนตัวแล้วฉันมักจะใช้ Kalman มากกว่านิสัย

เป็นความจริงที่ว่าการประมาณสถานะที่ราบรื่นของรัฐมักจะมีความแปรปรวนน้อยกว่าการกรองดังนั้นฉันคิดว่าคุณถูกต้องที่จะมีสัญชาติญาณเกี่ยวกับเรื่องนี้ แต่คุณไม่ได้ใช้รัฐจริงๆ โอกาสที่คุณพยายามขยายให้ใหญ่สุดนั้นไม่ใช่หน้าที่ของรัฐ


KF และ EM ต่างกันอย่างไร พวกเขาลงเอยด้วยการทำสิ่งเดียวกันในลักษณะที่คล้ายคลึงกันอย่างคลุมเครือ
มิทช์

1
@ Mitch ที่อาจเป็นสิ่งที่สมควรได้รับมากกว่าความคิดเห็น มันจะขึ้นอยู่กับเครื่องมือเพิ่มประสิทธิภาพวัตถุประสงค์ทั่วไปที่คุณใช้กับ KF และประเภทของ EM ที่คุณใช้ ฉันจะไม่แน่ใจเกินไปโดยไม่ได้ดูมัน
เทย์เลอร์

7

โดยทั่วไปตามกฎของผลิตภัณฑ์ความน่าจะเป็นที่แน่นอนสามารถเขียนได้ จากสมมติฐานของแบบจำลองสเปซสเปซมันเป็นไปตามนั้นเวกเตอร์ความคาดหวังและเมทริกซ์ความแปรปรวนของแต่ละเงื่อนไขในการสังเกตการณ์ที่ผ่านมาสามารถแสดงเป็น และ y i E ( y i | y 1 , , y i - 1 )

(Y1,...,Yn)=(Y1)Πผม=2n(Yผม|Y1,...,Yผม-1).
YผมV a r ( y i | y 1 , , y i - 1 )
E(Yผม|Y1,...,Yผม-1)=E(Hxเสื้อ+AZเสื้อ+Wเสื้อ|Y1,...,Yผม-1)=HE(xเสื้อ|Y1,...,Yผม-1)+AZเสื้อ+EWเสื้อ=Hx^เสื้อ|เสื้อ-1+AZเสื้อ,
VaR(Yผม|Y1,...,Yผม-1)=VaR(Hxเสื้อ+AZเสื้อ+Wเสื้อ|Y1,...,Yผม-1)=HVaR(xเสื้อ|Y1,...,Yผม-1)H'+VaRWเสื้อ=HPเสื้อ|เสื้อ-1H'+R.
ดังนั้นสิ่งนี้จะให้โอกาสที่แน่นอนแก่คุณโดยไม่ต้องคำนวณการประมาณที่ราบรื่น

ในขณะที่คุณแน่นอนสามารถใช้การประมาณที่ราบรื่นซึ่งเป็นการประมาณที่ดีกว่าของรัฐที่ไม่รู้จัก แต่สิ่งนี้จะไม่ทำให้คุณมีโอกาสเกิดขึ้น ผลที่ตามมาคือคุณจะใช้ค่าที่สังเกตได้ของเพื่อประเมินค่าที่คาดหวังของตัวเองดังนั้นดูเหมือนว่าสิ่งนี้จะนำไปสู่การมีอคติในการประมาณการที่เกิดขึ้น Yผม


0

ฉันคิดว่าคำตอบที่ดีกว่าสำหรับ "ทำไม" การกระจายที่ไม่ราบรื่น (โดยทั่วไป) คือประสิทธิภาพ มันเป็นหลักการที่ตรงไปตรงมาในการคำนวณความเป็นไปได้ที่จะเกิดการปรับให้เรียบ ลบการสังเกต j เรียกใช้ Kalman นุ่มนวลบนข้อมูลที่เหลือ จากนั้นประเมินความน่าจะเป็นของสิ่งที่มองไม่เห็น y (j) ทำซ้ำสิ่งนี้สำหรับทุกคน สรุปโอกาสในการบันทึก เวอร์ชันที่เร็วขึ้นนี้ใช้งานได้กับบล็อก (สุ่ม) ของตัวอย่างที่ถูกระงับ (เช่น CV k-fold) ขอให้สังเกตว่ารูปแบบนี้ต้องการการใช้งานทั่วไปเพิ่มเติมของตัวกรองคาลมาน / นุ่มนวลซึ่งสามารถข้ามการอัปเดตการวัดตามที่ต้องการโดยพลการ การย้อนกลับ / การปรับให้เรียบไม่สามารถเข้าถึงการวัดได้ (อัลกอริทึม RTS อยู่แล้ว) และยังคงเหมือนเดิม

หากอนุกรมเวลา "นานพอ" อาจมีประโยชน์เล็กน้อยในการทำเช่นนี้เนื่องจากความน่าจะเป็นในการกรอง "เผาไหม้" การเริ่มต้นชั่วคราว แต่ถ้าชุดข้อมูลสั้นความน่าจะเป็นของการปรับราคาที่แพงกว่านั้นอาจจะคุ้มค่า ความราบรื่นในการแก้ไขคงที่อาจเป็นวิธีการแก้ปัญหาในระหว่าง

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.