ทำไมเราต้องการพล็อตการติดตามสำหรับผลลัพธ์ MCMC


12

ฉันกำลังอ่านรายงานการวิจัยโดยใช้วิธีการ MCMC และฉันเห็นว่าส่วนใหญ่ให้แผนการแปลง เหตุใดเราจึงต้องมีแผนการแปลงร่องรอยใน Monte Carlo Markov Chain พล็อตการติดตามของพารามิเตอร์ระบุอะไร

คำตอบ:


17

คุณสร้างพล็อตการติดตามพารามิเตอร์เพื่อให้แน่ใจว่าการแจกแจงเบื้องต้นของคุณได้รับการสอบเทียบอย่างดีซึ่งระบุโดยพารามิเตอร์ของคุณว่ามีการเปลี่ยนแปลงสถานะเพียงพอเมื่ออัลกอริทึม MCMC ทำงาน

ตัวอย่างสุดขีดคือคุณตั้งค่าความแปรปรวนการกระจายแบบนิรนัยที่ 0 จากนั้นการประมาณพารามิเตอร์หลังจะไม่เปลี่ยนแปลง อัลกอริทึมของคุณจะบอกว่าคุณมีค่าประมาณพารามิเตอร์ที่ดีที่สุด แต่ก็ไม่ได้ตรวจสอบจำนวนพารามิเตอร์ที่เพียงพอเพื่อพิจารณาว่าสิ่งนี้เหมาะสมที่สุดหรือไม่ หากคุณตั้งค่าความแปรปรวนการกระจายนิรนัยสูงเกินไปคุณจะได้รับปัญหาที่คล้ายกัน นี่เป็นเพราะพารามิเตอร์ใหม่มีโอกาสน้อยที่จะเกี่ยวข้องกับข้อมูลของคุณดังนั้นโอกาสในการบันทึกที่คำนวณด้วยพารามิเตอร์ใหม่ของคุณจึงไม่น่าจะดีกว่าความน่าจะเป็นบันทึกโดยใช้พารามิเตอร์เก่า (ตัวอย่างคือถ้าพารามิเตอร์ "จริง" ของคุณคือ 0.5 และการประมาณการเริ่มต้นของคุณคือ 2 แต่คุณกำลังเลือกจากการแจกแจงแบบปกติด้วยค่าเฉลี่ย 2 และความแปรปรวนที่ 10,000 คุณไม่น่าจะได้รับพารามิเตอร์ที่ใกล้เคียงกับ 1 .

คุณต้องเลือกความแปรปรวนแบบลำดับต้นที่อนุญาตให้พารามิเตอร์พารามิเตอร์ของคุณเปลี่ยนแปลงได้เพียงพอที่คุณจะไม่ติดอยู่กับค่าต่ำสุดและค่าสูงสุดในการกระจายแบบโลจิคัล แต่ก็ยังดีพอที่คุณจะได้รับการประมาณพารามิเตอร์ที่เหมาะสม วรรณกรรมส่วนใหญ่แนะนำให้คุณรับพารามิเตอร์ของคุณเพื่อเปลี่ยนสถานะ 40-60% ของเวลา

อีกเหตุผลหนึ่งสำหรับแผนการแปลงคือการเผาไหม้โดยปกติการเขียนในช่วงเวลาชัดเจนในพล็อต (ตัวอย่างเช่นถ้าพารามิเตอร์ที่แท้จริงคือ 1.5 และการประมาณการเริ่มต้นของคุณคือ 4 จากนั้นคุณควรเห็นการประมาณพารามิเตอร์เคลื่อนที่อย่างรวดเร็วจาก 4 ถึง 1.5 จากนั้น "กระดอน" ประมาณ 1.5) โดยทั่วไปคุณเพียงยกเว้นการวนซ้ำ n ครั้งแรกที่ n มีขนาดใหญ่พอที่คุณจะแน่ใจว่าได้ลบการเบิร์น (กล่าว 1,000) แต่ถ้าการคำนวณใช้เวลานานหรือหากการประมาณพารามิเตอร์ของคุณใช้เวลานานกว่าการบรรจบกัน อนุญาตจากนั้นคุณอาจต้องการละเว้นการสังเกตมากขึ้นหรือน้อยลงเพื่อพิจารณาการเบิร์นอินคุณสามารถตรวจสอบพล็อตของคุณเพื่อดูว่าการเบิร์นอินสิ้นสุดลงเมื่อใดเพื่อให้แน่ใจว่าการเบิร์นอินไม่มีผลต่อผลลัพธ์ของคุณ

โปรดทราบว่าฉันได้พูดคุยในบริบทของการประมาณการจุดพารามิเตอร์ หากคุณกำลังประเมินความแปรปรวนของพารามิเตอร์ให้แน่ใจว่าคุณมีการเปลี่ยนแปลงสถานะที่เหมาะสมนั้นสำคัญกว่า


5
+1 แต่อีกด้านหนึ่งของมันคือเราไม่เชื่อมั่นในการวิเคราะห์การลู่แบบเป็นทางการและต้องการที่จะมองอะไรบางอย่างก่อนที่เราจะอ้างว่ามันมาบรรจบกัน ว่านี่คือเหตุผลทั้งหมดเป็นคำถามอื่น ...
conjugateprior

1
ขออภัยที่จะขุดโพสต์เก่านี้ แต่ค่าก่อนหน้านี้ (สร้างจากการกระจายก่อนหน้านี้) ควรจะไม่เกี่ยวข้องตราบใดที่มีจำนวนการทำซ้ำที่เพียงพอหรือไม่
mscnvrsy

@mscnvrsy: คุณสามารถใส่ข้อมูลที่ไม่ได้มาก่อนอย่างเช่นชุดก่อนหน้าหรือชุดเครื่องแบบของ Jeffry ล่วงหน้าหากคุณต้องการให้ข้อมูลน้อยลงแก่คุณก่อน
Benzamin

3
ฉันไม่เห็นด้วยอย่างสมบูรณ์กับความคิดที่ว่าแผนการแปลง MCMC นั้นเกี่ยวข้องกับการปรับเทียบการกระจายก่อนหน้านี้ อัลกอริทึม MCMC มีจุดมุ่งหมายที่การกระจายหลังได้รับไม่เกี่ยวข้องกับการเลือกก่อนและภายใต้เงื่อนไขที่เหมาะสมสร้างห่วงโซ่มาร์คอฟที่มาบรรจบกับการกระจายนิ่งนี้ การดูจุดแปลงมีประโยชน์ในการประเมินการลู่เข้าหรือการขาดของห่วงโซ่มาร์คอฟ
ซีอาน
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.