การวินิจฉัยที่เหลือในรูปแบบการถดถอยแบบ MCMC


21

ฉันเพิ่งลงมือเมื่อไม่นานมานี้ในแบบผสมการถดถอยที่เหมาะสมในกรอบ Bayesian โดยใช้อัลกอริทึม MCMC (ฟังก์ชั่น MCMCglmm ใน R จริง)

ฉันเชื่อว่าฉันเข้าใจวิธีการวินิจฉัยลู่เข้าของกระบวนการประมาณ (ติดตาม, พล็อต geweke, autocorrelation, การกระจายหลัง ... )

สิ่งหนึ่งที่ทำให้ฉันตกอยู่ในกรอบการทำงานของ Bayesian คือความพยายามอย่างมากที่จะอุทิศให้กับการวินิจฉัยเหล่านั้นในขณะที่ดูเหมือนว่าจะทำได้น้อยมากในแง่ของการตรวจสอบชิ้นส่วนที่เหลือของแบบจำลองที่ติดตั้ง ยกตัวอย่างเช่นใน MCMCglmm ส่วนฟังก์ชั่น residual.mcmc () นั้นยังมีอยู่ แต่ยังไม่ได้นำไปใช้จริง (เช่นส่งกลับ: "ส่วนที่เหลือยังไม่ได้นำไปใช้กับวัตถุ MCMCglmm"; เรื่องเดียวกันสำหรับทำนาย. ดูเหมือนว่าจะขาดจากแพ็คเกจอื่น ๆ เช่นกันและโดยทั่วไปแล้วจะมีการพูดคุยกันเล็กน้อยในวรรณคดีที่ฉันพบ

ใครช่วยชี้ให้ฉันถึงการอ้างอิงที่มีประโยชน์และรหัส R ที่ฉันสามารถเล่นหรือแก้ไขได้

ขอบคุณมาก.


เป็นคำถามที่ดีมาก ฉันชอบกระดาษของ Andrew Gelman กับ Cosma Shalizi มากเกี่ยวกับการตรวจสอบแบบจำลอง Bayesian
David J. Harris

คำตอบ:


7

ฉันคิดว่าการใช้คำที่เหลือไม่สอดคล้องกับการถดถอยแบบเบย์ โปรดจำไว้ว่าในแบบจำลองความน่าจะเป็นประจำนั้นคือพารามิเตอร์ที่พิจารณาว่าเป็นปริมาณที่ประมาณได้คงที่และกลไกการสร้างข้อมูลมีรูปแบบความน่าจะเป็นแบบสุ่มบางส่วนที่เกี่ยวข้องกับข้อมูลที่สังเกตได้ สำหรับ Bayesians พารามิเตอร์ของตัวแบบความน่าจะเป็นตัวแปรและข้อมูลคงที่จะปรับปรุงความเชื่อของเราเกี่ยวกับพารามิเตอร์เหล่านั้น ดังนั้นถ้าคุณได้รับการคำนวณค่าความแปรปรวนของการสังเกตลบติดตั้งค่าในรูปแบบการถดถอยที่สังเกตองค์ประกอบจะมีความแปรปรวน 0 ส่วนองค์ประกอบที่ประกอบจะแตกต่างกันไปตามฟังก์ชั่นของความหนาแน่นของความน่าจะเป็นหลังสำหรับพารามิเตอร์แบบจำลอง นี่คือสิ่งที่ตรงกันข้ามกับสิ่งที่คุณจะได้รับจากตัวแบบการถดถอยแบบบ่อยครั้ง ฉันคิดว่าหากมีใครสนใจที่จะตรวจสอบสมมติฐานความน่าจะเป็นของโมเดลการถดถอยแบบเบย์ของพวกเขา QQplot อย่างง่าย ๆ ของความหนาแน่นหลังของการประมาณค่าพารามิเตอร์ (ประมาณจากการสุ่มตัวอย่าง MCMC ของเรา) กับการแจกแจงแบบปกติ สำหรับฟังก์ชั่นลิงค์ที่ไม่ใช่เชิงเส้น)


1
นี่เป็นคำตอบที่ดี อาจจะมีคำตอบที่ให้การสร้างแบบเบย์ที่มีประโยชน์ซึ่งคำนวณจากส่วนที่เหลือซึ่งติดตั้งแบบลบลบ แต่สิ่งนี้ไม่ควรถูกลดทอนลง
ely

3
นอกจากนี้อาจเป็นการดีที่จะชี้แจงว่าในการตั้งค่าแบบเบย์คุณไม่มีค่า "ติดตั้ง" คุณสามารถคำนวณค่าเฉลี่ยด้านหลังสำหรับอินพุตที่สังเกตได้เพื่อให้ได้ค่าประมาณการหลังสูงสุดของค่าที่คาดหวังของตัวแปรเป้าหมายที่อินพุตนั้น แต่นี่จะเป็นการลดทุกอย่างให้ชี้ไปซึ่งมักไม่ต้องการถ้าคุณทำการอนุมานแบบเบย์
ely

2
@EMS ใด ๆ เหล่านี้เป็นของที่เหลือที่มีความหมาย เพียงเพราะสิ่งหนึ่งเป็นแบบเบย์ไม่ได้หมายความว่าไม่มีใครสามารถตรวจสอบได้ว่าข้อสันนิษฐานนั้นสะท้อนให้เห็นในข้อมูลหรือไม่
Glen_b -Reinstate Monica

1
สำหรับการอนุมานความน่าจะเป็นที่แน่ชัด (สมมติฐานเกี่ยวกับความเป็นปกติในสถานที่) ในการตั้งค่าแบบบ่อยครั้ง "เศษเหลือ" จะเป็นการจำลองการทดลองที่มีเงื่อนไขโดยอิสระตามเงื่อนไขของ "ค่าติดตั้ง" (หรือค่าเฉลี่ยตามเงื่อนไข) ในโลกของเบย์ข้อมูลไม่ได้ถูกสุ่มดังนั้นอะไรจะเป็นเงื่อนไขอย่างอิสระจากสิ่งใด
AdamO

1
E[Y|X]XY
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.