MCMC มีประโยชน์เมื่อใด?


12

ฉันมีปัญหาในการทำความเข้าใจในสถานการณ์ที่แนวทาง MCMC มีประโยชน์จริง ๆ ฉันกำลังดูตัวอย่างของเล่นจากหนังสือ Kruschke "Doing Bayesian Data Analysis: A Tutorial with R and BUGS"

สิ่งที่ฉันเข้าใจเพื่อให้ห่างไกลคือการที่เราต้องมีการกระจายเป้าหมายซึ่งเป็นสัดส่วนกับp(D|θ)p(θ)เพื่อให้มีตัวอย่างของP(θ|D) ) อย่างไรก็ตามดูเหมือนว่าเมื่อเรามีp(D|θ)p(θ)เราเพียงต้องการทำให้การกระจายแบบปกติเพื่อให้ได้ภาพหลังและปัจจัยการทำให้เป็นมาตรฐานนั้นสามารถพบได้ง่ายในเชิงตัวเลข ดังนั้นสิ่งที่เป็นกรณีเมื่อเป็นไปไม่ได้?


2
สมมติว่าθไม่ใช่สเกลาร์ แต่เป็นเวกเตอร์มีขนาด 10000 θ
Jan Galkowski

1
คำตอบของฉันเป็นเรื่องย่อเล็กน้อย ที่จะได้รับอย่างต่อเนื่องที่ต้องคำนวณtheta) แม้แต่ในกรณีของเซนต์คิตส์และเนวิสสมมติว่านั้นไร้ค่าจริง ๆ ดังนั้นการรวมกันก็ทำได้ยากแม้แต่ตัวเลข จากนั้นคุณอาจต้องการใช้ MCMC p(D|θ)p(θ)p(D|θ)
Jan Galkowski

2
คำเตือนจาก Alan Sokal: "Monte Carlo เป็นวิธีการที่ไม่ดีอย่างยิ่งควรใช้เฉพาะเมื่อวิธีการอื่น ๆ ทั้งหมดนั้นแย่ที่สุด" จากนั้นเขาก็เริ่มใช้วิธีการพูดคุยที่ยาวนานของ MC stat.unc.edu/faculty/cji/Sokal.pdf
Yair Daon

1
@Yair: ฟังดูเหมือนว่า Sokal กำลังส่ง Churchill
พระคาร์ดินัล

1
เมื่อไม่มีสิ่งใดจะทำงานได้อีกต่อไป ...
kjetil b halvorsen

คำตอบ:


10

การบูรณาการ Monte Carloเป็นรูปแบบหนึ่งของการรวมตัวเลขซึ่งสามารถมีประสิทธิภาพมากกว่าเช่นการรวมตัวเลขโดยการประมาณการรวมเข้าด้วยกันกับพหุนาม โดยเฉพาะอย่างยิ่งในมิติที่สูงซึ่งเทคนิคการรวมเชิงตัวเลขอย่างง่ายต้องการการประเมินฟังก์ชันจำนวนมาก การคำนวณการฟื้นฟูอย่างต่อเนื่อง , เราสามารถใช้การสุ่มตัวอย่างสำคัญ ,p(D)

p(D)=q(θ)q(θ)p(θ)p(Dθ)dθ1Nnwnp(θn)p(Dθn),

ที่และเป็นตัวอย่างจากคิวโปรดทราบว่าเราจำเป็นต้องประเมินการกระจายตัวของข้อต่อ ณ จุดที่สุ่มตัวอย่างเท่านั้น สำหรับถูกต้องตัวประมาณค่านี้อาจมีประสิทธิภาพมากในแง่ของความต้องการตัวอย่างน้อยมาก ในทางปฏิบัติการเลือกที่เหมาะสมอาจเป็นเรื่องยาก แต่นี่คือสิ่งที่ MCMC สามารถช่วยได้! การสุ่มตัวอย่างความสำคัญอบอ่อน(Neal, 1998)รวม MCMC เข้ากับการสุ่มตัวอย่างที่สำคัญwn=1/q(θn)θnqqq

อีกเหตุผลหนึ่งที่ MCMC มีประโยชน์คือ: เรามักจะไม่สนใจความหนาแน่นของหลังแต่ในสถิติสรุปและความคาดหวังเช่นθ

p(θD)f(θ)dθ.

การรู้ไม่ได้หมายความว่าเราสามารถแก้อินทิกรัลนี้ได้ แต่ตัวอย่างเป็นวิธีที่สะดวกมากในการประมาณค่าp(D)

ในที่สุดความสามารถในการประเมินเป็นข้อกำหนดสำหรับวิธีการ MCMC แต่ไม่ทั้งหมด (เช่นMurray และคณะ, 2006 )p(Dθ)p(θ)


ขออภัย แต่ยังไม่ชัดเจนสำหรับฉัน คำถามของฉันคือ: ถ้าเราคูณเราจะได้ pdf ที่ไม่ปกติ ด้วยการเรียกใช้ MCMC เราจะได้รับตัวอย่างที่เราสามารถประมาณค่า pdf ที่ไม่ได้มาตรฐาน ถ้าเราต้องการเราสามารถทำให้ทั้งสองอย่างเป็นปกติ ดังนั้นการสันนิษฐานฉันไม่สนใจในสถิติสรุปใด ๆ แต่เฉพาะในผู้โพสต์ทำไมเราใช้ MCMC ในตอนแรก? ดังที่คุณกล่าวว่าวิธีการ MCMC บางอย่างไม่ต้องการการคำนวณของดังนั้นฉันไม่ได้อ้างอิงถึงสิ่งเหล่านั้น เท่าที่ฉันรู้ส่วนใหญ่ของพวกเขาต้องการการคำนวณ ประโยชน์ของวิธีการเหล่านี้คืออะไร? p(D|θ)p(θ)p(D|θ)p(θ)
Vaaal

2
เมื่อใช้งาน MCMC คุณจะได้รับตัวอย่างจากไฟล์ PDF มาตรฐานเพื่อหลีกเลี่ยงการคำนวณค่าคงที่มาตรฐาน และนี่คือฟรี
ซีอาน

2
@Vaaal: ข้อสันนิษฐานของคุณที่ว่า"ปัจจัยการทำให้ปกติสามารถพบได้ง่าย ๆ เป็นตัวเลข"เท่านั้นสำหรับการแจกแจง univariate อย่างง่าย สำหรับมิติสูง , normalizingโดยทั่วไปนั้นยากมาก ในกรณีนี้ MCMC ยังคงสามารถใช้ในการประเมินค่าคงที่การทำให้เป็นมาตรฐาน (เช่นผ่านการสุ่มตัวอย่างความสำคัญอบอ่อน) θp(Dθ)p(θ)
ลูคัส

6

เมื่อคุณได้รับก่อนและความน่าจะเป็นที่ไม่สามารถคำนวณได้ในรูปแบบปิดหรือเช่นการกระจายหลังไม่ใช่ประเภทมาตรฐานการจำลองโดยตรงจากเป้าหมายนี้ไปยังการประมาณค่า Monte Carlo ของการแจกแจงหลังนั้นไม่สามารถทำได้ ตัวอย่างทั่วไปจะทำของแบบจำลองลำดับชั้นกับไพรเออร์ที่ไม่ผันเช่นที่พบในหนังสือข้อบกพร่องp(θ)f(x|θ)

p(θ|x)p(θ)f(x|θ)

วิธีการจำลองทางอ้อมเช่นเทคนิคการยอมรับการปฏิเสธอัตราส่วนของชุดเครื่องแบบหรือการสุ่มตัวอย่างที่มีความสำคัญตามปกติจะพบปัญหาด้านตัวเลขและความแม่นยำเมื่อขนาดของพารามิเตอร์เพิ่มขึ้นเกินกว่าสองสามหน่วยθ

ในทางตรงกันข้ามมาร์คอฟโซ่มอนติคาร์โลมีวิธีการที่คลี่คลายไปในมิติที่ใหญ่กว่าซึ่งพวกเขาสามารถสำรวจการกระจายของหลังในท้องถิ่นเช่นในพื้นที่ใกล้เคียงของค่าปัจจุบันและในจำนวนที่น้อยกว่าขององค์ประกอบคือบนพื้นที่ subspaces ยกตัวอย่างเช่นตัวอย่างกิ๊บส์ตรวจสอบความคิดที่จำลองมาจากเป้าหมายหนึ่งมิติในแต่ละครั้งนั่นคือการแจกแจงแบบมีเงื่อนไขเต็มรูปแบบที่เกี่ยวข้องกับนั้นเพียงพอที่จะบรรลุการจำลองจากหลังจริงในระยะยาวp(θ|x)

วิธีมาร์คอฟโซ่มอนติคาร์โลยังมีระดับความเป็นสากลในอัลกอริธึมเช่นอัลกอริธึมมหานคร - เฮสติ้งส์อย่างเป็นทางการสำหรับการกระจายหลังที่สามารถคำนวณได้อย่างต่อเนื่องp(θ|x)

ในกรณีที่ไม่สามารถคำนวณได้อย่างง่ายดายมีทางเลือกทั้งการกระจายนี้เป็นการกระจายที่สามารถจัดการได้ในพื้นที่ขนาดใหญ่เช่นในหรือผ่านวิธีการที่ไม่ใช่ Markovian เช่นเอบีซีp(θ)f(x|θ)

p(θ)f(x|θ)g(z|θ,x)p(θ)f(x|θ)dz

วิธีการของ MCMC ทำให้กว้างขวางมากขึ้นสำหรับวิธีการแบบเบย์ดังที่แสดงโดยการขึ้นที่เกิดขึ้นตามการนิยมของวิธีการโดย Alan Gelfand และ Adrian Smith ในปี 1990


ลิงก์ไปยัง THE BUGS BOOK ไม่ทำงานอีกต่อไป
HelloWorld
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.