อนุญาตให้ใช้ข้อมูลเพื่อกำหนดค่า Priors จากนั้นเรียกใช้แบบจำลองด้วย Priors เหล่านี้ (เช่นนักบวชที่ขับเคลื่อนด้วยข้อมูลจากชุดข้อมูลเดียวกัน)


9

เป็นความเข้าใจของฉันที่เราไม่ควรอนุญาตให้มีชุดข้อมูลเดียวกับที่เรากำลังวิเคราะห์เพื่อขับเคลื่อน / กำหนดว่าการกระจายก่อนหน้านี้มีลักษณะอย่างไรในการวิเคราะห์แบบเบย์ โดยเฉพาะอย่างยิ่งมันไม่เหมาะสมที่จะกำหนดการกระจายก่อนหน้านี้สำหรับการวิเคราะห์แบบเบส์ตามสถิติสรุปจากชุดข้อมูลเดียวกันที่คุณจะใช้นักบวชเพื่อช่วยให้พอดีกับแบบจำลอง

มีใครรู้บ้างเกี่ยวกับทรัพยากรที่พูดถึงเรื่องนี้โดยเฉพาะว่าไม่เหมาะสมหรือไม่? ฉันต้องการการอ้างอิงบางอย่างสำหรับปัญหานี้


คำตอบ:


11

ใช่สิ่งนี้ไม่เหมาะสมเพราะใช้ข้อมูลเดียวกันสองครั้งนำไปสู่ผลลัพธ์ที่ไม่มั่นใจ สิ่งนี้เรียกว่า 'การจุ่มสองครั้ง'

สำหรับการอ้างอิงฉันจะเริ่มต้นด้วย Carlin และ Louis (2000) แม้ว่า 'การจุ่มสองครั้ง' เป็นหนึ่งในบทวิจารณ์หลักของ Empirical Bayes, Ch. 3 โดยเฉพาะในส่วนที่ 3.5 ของหนังสือเล่มนี้อธิบายวิธีการประเมินช่วงความมั่นใจที่เหมาะสมโดยใช้วิธีการ EB

เบอร์เกอร์เจ (2549) \ กรณีการวิเคราะห์แบบเบย์แบบมีวัตถุประสงค์. "การวิเคราะห์แบบเบย์, 1 (3), 385 {402

Bradley P. Carlin, Thomas A. Louis 2000 วิธีการ Bayes และ Empirical Bayes สำหรับการวิเคราะห์ข้อมูล

Darniede, WF 2011 วิธีการแบบเบย์สำหรับนักบวชที่พึ่งพาข้อมูล วิทยานิพนธ์ปริญญาโทสาขารัฐโอไฮโอ

Gelman, A. , Carlin, JB, Stern, HS, และ Rubin, DB (2003), วิเคราะห์ข้อมูล Bayesian, ysis, รุ่นที่สอง (แชปแมน & ฮอลล์ / CRC ตำราวิทยาศาสตร์ทางสถิติ), Chap-man และ Hall / CRC, 2nd เอ็ด


@sarah โปรดลงทะเบียนบัญชีของคุณเพื่อให้คุณสามารถเรียกคืนคำถามของคุณได้ เพียงไปที่ URL นี้: stats.stackexchange.com/users/login

1

สามารถใช้ข้อมูลเพื่อสร้างก่อนได้

สำหรับตัวอย่างในการสร้างแบบจำลองผสมให้ดู Richardson & Green (1997): http://citeseer.ist.psu.edu/viewdoc/summary?doi=10.1.1.27.3667

พวกเขาใช้ค่าเฉลี่ยและช่วงของจุดข้อมูลเป็นไฮเปอร์พารามิเตอร์สำหรับก่อนหน้าและมันสมเหตุสมผลดี

ปัญหาของการใช้ข้อมูลเกิดขึ้นสองครั้งเมื่อมีข้อมูลมาก่อนในความเห็นของฉัน

ตราบใดที่คุณตรวจสอบว่าการกระจายก่อนหน้านี้ของคุณ "แบน" ซึ่งการกระจายหลังเป็นยอดแล้วคุณรู้ว่าการกระจายก่อนหน้าของคุณไม่มีผลกระทบที่แข็งแกร่งในผลลัพธ์


การใช้ข้อมูลเพื่อสร้างสิ่งก่อนหน้าไม่สามารถเกิดขึ้นภายในกระบวนทัศน์แบบเบย์ ดังนั้นจึงไม่สมเหตุสมผลจากมุมมองแบบเบย์และการตรวจสอบความถูกต้องตามปกติของขั้นตอนแบบเบย์ไม่ได้นำมาใช้ การอนุมานที่เกิดขึ้นอาจใช้ได้อย่างสมบูรณ์ แต่ต้องแสดงให้เห็นจากหลักการแรก (ริชาร์ดสันและกรีนใช้สิ่งที่เรียกว่าเบย์เชิงประจักษ์ซึ่งไม่ใช่ขั้นตอนแบบเบย์)
ซีอาน

แม้ว่ามันจะไม่สมเหตุสมผลในกระบวนทัศน์เบย์บางครั้งเส้นแบ่งระหว่างสิ่งที่เป็นข้อมูลและสิ่งที่ก่อนหน้านี้คือ difficukt ที่จะวาด ดูคำตอบของฉันใน stats.stackexchange.com/questions/112451/…
kjetil b halvorsen
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.