ปัญหา:ฉันต้องการทำการสุ่มตัวอย่างของกิ๊บส์เพื่อสรุปหลังชุดข้อมูลขนาดใหญ่ โชคไม่ดีโมเดลของฉันไม่ง่ายนักและการสุ่มตัวอย่างช้าเกินไป ฉันจะพิจารณาแนวทางที่หลากหลายหรือขนาน แต่ก่อนที่จะไปไกล ...
คำถาม:ฉันต้องการทราบว่าฉันสามารถสุ่มตัวอย่างตัวอย่าง (พร้อมการแทนที่) จากชุดข้อมูลของฉันที่การวนซ้ำของกิ๊บส์ทุกครั้งหรือไม่
สัญชาตญาณของฉันคือแม้ว่าฉันจะเปลี่ยนตัวอย่างฉันจะไม่เปลี่ยนความหนาแน่นของความน่าจะเป็นและดังนั้นตัวอย่างกิ๊บส์ไม่ควรสังเกตเห็นเคล็ดลับ ฉันถูกไหม? มีผู้อ้างอิงบางคนที่ทำสิ่งนี้หรือไม่?
1
ในฐานะที่เป็นกัน: ความคิดอื่นจะทำการวิเคราะห์หลายชุดย่อยสุ่มของชุดข้อมูลขนาดใหญ่ ด้วยวิธีนี้คุณสามารถตรวจสอบข้ามได้
—
คาดเดา
ฉันไม่สามารถตอบคำถามที่ถูกต้องของคุณได้ด้วยสิทธิ์ใด ๆ (แม้ว่าความสงสัยของฉันคือคุณจะเพิ่มข้อผิดพลาดโดยประมาณที่มาพร้อมกับ Monte Carlo) ความจริงที่น่าเศร้าก็คือนี่เป็นเพียงแง่มุมที่โชคร้ายของการวิเคราะห์ MCMC แบบเบส์ เเพง. @ ข้อคิดเห็นเกี่ยวกับความคิดเห็นเป็นความคิดที่ดี แต่ไม่ได้เป็นหัวใจของปัญหา: มันแพงเกินไปที่จะดึงตัวอย่างเหล่านั้นทั้งหมดสำหรับแต่ละคน คำแนะนำของฉันคือการเขียนรหัส C ของคุณเองสำหรับงานหนัก (Rcpp ใน R, Cython ใน Python และอื่น ๆ ) และยังขนาน (เมื่อไม่มีการพึ่งพาสาขา)
@conjectures ฟังดูเหมือนกระเป๋าบูตเล็ก ๆ ของ Michael Jordan
—
jaradniemi
ฉันขอแนะนำให้เปลี่ยนตัวอย่างของคุณเพื่อหลีกเลี่ยงการเพิ่มตัวแปรแฝงทั้งหมด คุณจะไม่มีตัวอย่างกิ๊บส์อีกต่อไป แต่อัลกอริทึม Metropolis-Hastings พร้อมข้อเสนอที่อิงจากการประมาณค่าปกติกับโอกาสที่จะใช้งานได้ดี ดูส่วนที่ 16.4 ของการวิเคราะห์ข้อมูลแบบเบย์รุ่นที่ 2
—
jaradniemi
นี่เป็นส่วนของการวิจัยเชิงรุกที่ฉันไม่รู้ดีพอที่จะสรุปให้คุณได้อย่างถูกต้อง ดูตัวอย่างjmlr.org/proceedings/papers/v32/bardenet14.pdfและarxiv.org/pdf/1304.5299v4.pdf
—
Andrew M