Hamiltonian Monte Carlo: จะทำให้รู้สึกถึงข้อเสนอของ Metropolis-Hasting ได้อย่างไร


9

ฉันพยายามที่จะเข้าใจการทำงานภายในของ Hamiltonian Monte Carlo (HMC) แต่ไม่สามารถเข้าใจส่วนนี้ได้อย่างสมบูรณ์เมื่อเราแทนที่การรวมเวลาที่กำหนดไว้กับข้อเสนอ Metropolis-Hasting ฉันกำลังอ่านกระดาษเกริ่นนำสุดยอด A บทนำเกี่ยวกับแนวคิดของมิลโตเนียนมอนติคาร์โลโดย Michael Betancourt ดังนั้นฉันจะทำตามสัญกรณ์เดิมที่ใช้ในนั้น

พื้นหลัง

เป้าหมายทั่วไปของ Markov Chain Monte Carlo (MCMC) เป็นที่ใกล้เคียงกับการกระจายของตัวแปรเป้าหมายQπ(Q)Q

ความคิดของ HMC คือการแนะนำผู้ช่วย "โมเมนตัม" ตัวแปรร่วมกับตัวแปรเดิมที่ถูกจำลองเป็นตำแหน่ง "" คู่ตำแหน่ง - โมเมนตัมเป็นพื้นที่เฟสขยายและสามารถอธิบายได้โดยการเปลี่ยนแปลงของมิลโตเนียน ข้อต่อการกระจายสามารถเขียนได้ในแง่ของการสลายตัวของ microcanonical:พีQπ(Q,พี)

π(Q,พี)=π(θE|E)π(E) ,

ที่หมายถึงพารามิเตอร์ในการให้ระดับพลังงานยังเป็นที่รู้จักในฐานะที่เป็นชุดปกติ ดูภาพประกอบที่ 21 และรูปที่ 22 ของกระดาษθE(Q,พี)E

ป้อนคำอธิบายรูปภาพที่นี่

โพรซีเดอร์ HMC ดั้งเดิมประกอบด้วยสองขั้นตอนต่อไปนี้:

  • ขั้นตอนสุ่มที่ดำเนินการสุ่มเปลี่ยนระหว่างระดับพลังงานและ

  • ขั้นตอนที่กำหนดขึ้นซึ่งดำเนินการรวมเวลา (โดยปกติแล้วจะดำเนินการผ่านการรวมตัวเลขของเกมเสือข้ามห้วย) ตามระดับพลังงานที่กำหนด

ในกระดาษมันเป็นที่ถกเถียงกันอยู่ว่าเกมเสือข้ามห้วย (หรือ symplectic integrator) มีข้อผิดพลาดเล็ก ๆ น้อย ๆ ที่จะแนะนำอคติเชิงตัวเลข ดังนั้นแทนที่จะถือเป็นขั้นตอนที่กำหนดไว้เราควรเปลี่ยนให้เป็นข้อเสนอ Metropolis-Hasting (MH) เพื่อทำให้ขั้นตอนนี้เป็นแบบสุ่มและกระบวนการผลลัพธ์จะให้ตัวอย่างที่แน่นอนจากการแจกแจง

ข้อเสนอ MH จะทำตามขั้นตอนของการดำเนินการเกมเสือข้ามห้วยแล้วพลิกโมเมนตัม ข้อเสนอจะได้รับการยอมรับโดยมีความน่าจะเป็นที่ยอมรับได้ดังต่อไปนี้:L

a(QL,-พีL|Q0,พี0)=ม.ผมn(1,ประสบการณ์(H(Q0,พี0)-H(QL,-พีL)))

คำถาม

คำถามของฉันคือ:

1) เหตุใดการดัดแปลงของการเปลี่ยนการรวมเวลาที่กำหนดไว้นี้เป็นข้อเสนอ MH จึงยกเลิกอคติเชิงตัวเลขเพื่อให้กลุ่มตัวอย่างที่สร้างขึ้นปฏิบัติตามการกระจายเป้าหมายอย่างแม่นยำ?

2) จากมุมมองทางฟิสิกส์พลังงานจะได้รับการอนุรักษ์ในระดับพลังงานที่กำหนด นั่นเป็นเหตุผลที่เราสามารถใช้สมการของแฮมิลตันได้:

dQdเสื้อ=Hพี,dพีdเสื้อ=-HQQ}

ในแง่นี้พลังงานที่ควรจะคงที่ทุกที่ในชุดปกติจึงควรจะเท่ากับ-p_L) ทำไมมีพลังงานต่างกันที่ทำให้เราสามารถสร้างความน่าจะเป็นที่ยอมรับได้H(Q0,พี0)H(QL,-พีL)

คำตอบ:


7

วิถีแฮมิลตันที่กำหนดขึ้นนั้นมีประโยชน์เพียงเพราะมันสอดคล้องกับการกระจายเป้าหมาย โดยเฉพาะอย่างยิ่งวิถีที่มีโครงการพลังงานทั่วไปเข้าสู่ภูมิภาคที่มีความน่าจะเป็นสูงในการกระจายเป้าหมาย ถ้าเราสามารถบูรณาการสมแฮมิลตันตรงและสร้างไบร์ทมิลอย่างชัดเจนแล้วเราจะมีขั้นตอนวิธีการแล้วเสร็จสมบูรณ์และไม่จำเป็นต้องมีขั้นตอนการยอมรับใด

น่าเสียดายนอกเหนือจากตัวอย่างง่ายๆที่เราไม่สามารถรวมสมการของแฮมิลตันได้ นั่นเป็นเหตุผลที่เราจะต้องนำมาในการติดตั้ง symplectic ผู้รวบรวม symplectic ใช้ในการสร้างการประมาณเชิงตัวเลขที่มีความแม่นยำสูงสำหรับวิถีไบเรเมียนที่แน่นอนซึ่งเราไม่สามารถแก้ปัญหาเชิงวิเคราะห์ได้ ข้อผิดพลาดเล็ก ๆ ที่มีอยู่ใน symplectic integrators ทำให้วิถีการคำนวณตัวเลขเหล่านี้เบี่ยงเบนไปจากวิถีที่แท้จริงและด้วยเหตุนี้การคาดการณ์ของวิถีการเคลื่อนที่เชิงตัวเลขจึงเบี่ยงเบนไปจากชุดการกระจายเป้าหมายทั่วไป เราจำเป็นต้องแนะนำวิธีการแก้ไขความเบี่ยงเบนนี้

การดำเนินการดั้งเดิมของ Hamiltonian Monte Carlo ถือว่าเป็นจุดสุดท้ายในเส้นทางโคจรของความยาวคงที่เป็นข้อเสนอจากนั้นจึงใช้ขั้นตอนการยอมรับของมหานครกับข้อเสนอนั้น หากวิถีการคำนวณมีการสะสมข้อผิดพลาดมากเกินไปและเบี่ยงเบนไปจากพลังงานเริ่มต้นมากเกินไปดังนั้นการเสนอนั้นจะถูกปฏิเสธ กล่าวอีกนัยหนึ่งขั้นตอนการยอมรับทิ้งข้อเสนอที่จบลงด้วยการคาดการณ์ไกลเกินไปจากชุดการกระจายเป้าหมายทั่วไปเพื่อให้กลุ่มตัวอย่างเดียวที่เราเก็บไว้คือกลุ่มที่ตกอยู่ในชุดทั่วไป

โปรดทราบว่าการใช้งานที่ทันสมัยกว่าที่ฉันสนับสนุนในกระดาษแนวคิดไม่ได้อยู่ในความเป็นจริงอัลกอริทึม Metropolis-Hastings การสุ่มเส้นทางสุ่มจากนั้นจุดสุ่มจากวิถีการสุ่มนั้นเป็นวิธีทั่วไปที่จะแก้ไขข้อผิดพลาดเชิงตัวเลขที่แนะนำโดยผู้รวมระบบ symplectic Metropolis-Hastings เป็นเพียงวิธีหนึ่งในการใช้อัลกอริทึมทั่วไปนี้ให้มากขึ้น แต่การสุ่มตัวอย่าง slice (เสร็จแล้วใน NUTS) และการสุ่มตัวอย่าง multinomial แต่ท้ายที่สุดแล้วสัญชาตญาณก็เหมือนกัน - เราจะเลือกจุดที่มีข้อผิดพลาดเล็กน้อยเพื่อให้แน่ใจว่าตัวอย่างที่แน่นอนจากการกระจายเป้าหมาย


ขอบคุณ @Michael Betancourt !! ตามแนวคิดตอนนี้ฉันได้รับแนวคิดในการสร้างความน่าจะเป็นในขั้นตอนการรวมเวลาขึ้นอยู่กับว่ารัฐบูรณาการเบี่ยงเบนจากวิถีมากแค่ไหน อย่างไรก็ตามวิธีการสร้างความน่าจะเป็นที่ยอมรับนั้นไม่สมเหตุสมผลสำหรับฉันอย่างที่คิดว่าเรากำลังสนับสนุนการเบี่ยงเบนที่ทำให้เกิดพลังงานต่ำ หากต่ำกว่ามากเราจะยอมรับข้อเสนอเสมอหรือไม่แม้ว่ามันจะเบี่ยงเบนความสนใจไปมาก H(QL,-พีL)H(Q0,พี0)
cwl

1
ใช่ แต่เนื่องจากปริมาณในพื้นที่มิติสูงทำงานได้อย่างไร (ปริมาณมากขึ้นไปทางด้านนอกของพื้นผิวมากกว่าด้านในของมัน) วิถีการใช้จ่ายชี้แจงเพิ่มเติมเวลาเบี่ยงเบนไปสู่พลังงานที่สูงกว่าพลังงานที่ต่ำกว่า ดังนั้นเมื่อคุณรวมข้อเสนอ (ซึ่งเป็นประโยชน์ต่อพลังงานที่สูงกว่า) กับการยอมรับ (ซึ่งสนับสนุนพลังงานที่ต่ำกว่า) คุณจะได้รับความสมดุลจากพลังงานเริ่มต้น
Michael Betancourt
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.