เหตุใดการกำหนดพารามิเตอร์ซ้ำซ้อนจึงเพิ่มความเร็วใน Gibbs MCMC


12

ในหนังสือของ Gelman & Hill (2007) (การวิเคราะห์ข้อมูลโดยใช้การถดถอยและโมเดลหลายระดับ / ลำดับชั้น) ผู้เขียนอ้างว่าการรวมพารามิเตอร์ที่ซ้ำซ้อนสามารถช่วยเร่ง MCMC ได้

ตัวอย่างที่กำหนดเป็นรูปแบบที่ไม่ใช่ซ้อนกันของ "flight simulator" (Eq 13.9):

yiN(μ+γj[i]+δk[i],σy2)γjN(0,σγ2)δkN(0,σδ2)

พวกเขาแนะนำการแก้ไขใหม่เพิ่มพารามิเตอร์ค่าเฉลี่ยและดังนี้:μγμδ

γjN(μγ,σγ2)δkN(μδ,σδ2)

เหตุผลเดียวที่มีให้คือ (หน้า 420):

เป็นไปได้สำหรับการจำลองที่จะติดอยู่ในการกำหนดค่าที่ทั้งเวกเตอร์ (หรือ ) อยู่ไกลจากศูนย์ (แม้ว่าพวกเขาจะได้รับมอบหมายการกระจายที่มีค่าเฉลี่ย 0) ในที่สุดการจำลองจะมาบรรจบกันเพื่อการกระจายที่ถูกต้อง แต่เราไม่ต้องการที่จะต้องรอγδ

พารามิเตอร์ค่าเฉลี่ยที่ซ้ำซ้อนช่วยด้วยปัญหานี้ได้อย่างไร

สำหรับฉันแล้วดูเหมือนว่าโมเดลที่ไม่ซ้อนกันนั้นส่วนใหญ่จะช้าเพราะและมีความสัมพันธ์เชิงลบ (อันที่จริงถ้ามีใครขึ้นไปอีกคนหนึ่งจะต้องลงไปเพราะข้อมูลจะถูก "แก้ไข") พารามิเตอร์ค่าเฉลี่ยที่ซ้ำซ้อนช่วยลดความสัมพันธ์ระหว่างและหรืออย่างอื่นได้หรือไม่?γδγδ


คุณกำลังมองหาข้อมูลเชิงลึกที่เข้าใจง่ายเกี่ยวกับปัญหานี้ (เช่นไม่ว่าจะเป็นความสัมพันธ์ -หรือความสัมพันธ์ -และ - ) หรือคุณกำลังมองหาความเข้าใจอย่างลึกซึ้งเกี่ยวกับปัญหาทั่วไป ( เช่นแนวคิดของการจัดกึ่งกลางลำดับชั้น)? ในกรณีหลังนี้คุณต้องการปรีชาที่ใกล้เคียงกับการพิสูจน์หรือสัญชาตญาณที่หลวมมากขึ้นและแสดงให้เห็นว่ามันใช้งานได้หรือไม่ γδγμδμ
Sextus Empiricus

ฉันต้องการความเข้าใจอย่างถ่องแท้เกี่ยวกับแนวคิดของการจัดกึ่งกลางโดยทั่วไป (เนื่องจากกรณีเฉพาะในคำถามนั้นเป็นการประยุกต์ใช้การจัดกึ่งกลางแบบลำดับชั้นโดยตรง) จุดสำคัญที่ฉันต้องการความเข้าใจเกี่ยวกับคือทำไมไม่ทำงานตรงกลางลำดับชั้นถ้าความแปรปรวนในระดับกลุ่มที่เป็นส่วนหนึ่งของความแปรปรวนทั้งหมด ? บทความโดย Gelfand และคณะ พิสูจน์ทางคณิตศาสตร์นี้ (เช่นได้รับความสัมพันธ์และค้นหาพฤติกรรมการ จำกัด ของมัน) แต่ไม่มีคำอธิบายที่ใช้งานง่าย
ไฮเซนเบิร์ก

คำตอบ:


4

ความสัมพันธ์ที่จะหลีกเลี่ยงเป็นหนึ่งระหว่างและและ\μγjδk

ด้วยการแทนที่และในโมเดลการคำนวณด้วยพารามิเตอร์ทางเลือกที่อยู่ตรงกลางความสัมพันธ์จะลดลงγjδkμ

ดูคำอธิบายที่ชัดเจนมากในส่วน 25.1 'การจัดกึ่งกลางแบบลำดับชั้นคืออะไร' ในหนังสือ (มีให้บริการฟรี) หนังสือ'การประเมิน MCMC ใน MLwiN'โดย William J. Browne และอื่น ๆ http://www.bristol.ac.uk/cmm/software/mlwin/download/manuals.html


ส่วนที่ 25.1 ของ 'การประมาณค่า MCMC MlwiN' อธิบายเทคนิค "การจัดกึ่งกลางกึ่งกลาง" นี้ แต่ไม่ได้ลงรายละเอียดใด ๆ เพิ่มเติมนอกเหนือจากการอ้างว่ามันใช้งานได้ จากการอ้างอิงของมันฉันพบว่าการพิสูจน์ที่แท้จริงของเทคนิคนี้ถูกนำเสนอในบทความParametrizations ที่มีประสิทธิภาพสำหรับโมเดลเชิงเส้นเชิงเส้นปกติโดย Gelfand et al, Biometrika เล่มที่ 82 ฉบับที่ 3
Heisenberg

บทความด้านบนนี้ใช้ประโยชน์จากคุณสมบัติของการแจกแจงแบบปกติโดยไม่ต้องอธิบาย ฉันพบหลักฐานของคุณสมบัติเหล่านั้นในการวิเคราะห์การผันแบบเบส์ของการกระจายแบบเกาส์โดยเควินเมอร์ฟี่
ไฮเซนเบิร์ก

น่าเสียดายที่ฉันยังไม่เห็นคำอธิบายที่เข้าใจง่ายว่าทำไมเทคนิคนี้จึงใช้งานได้
ไฮเซนเบิร์ก

มันสายไปแล้ว แต่ฉันคิดว่าบทความนี้อาจเป็นสิ่งที่คุณกำลังมองหา
บารูต
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.